داده كاوي و كاربرد آن در پزشكي

31
ي ك ش ز پ در ن زد آ پ و كار دآده كاوي دآ ام خ ن ب: ي ي و ج ش ن ماره دآ ش ي( ق آ ك* رر ب ا : ب و ج ش ن ام دآ ب85233510 در( عات لا ط آ اوري ن ف زد پ ار درس كار ن ي م ش( وآه خ د ن ح و( ت ر( كت د اي( ق آ ات ن ح ما : ن ه اد رآ( ن س آ) ي ك ش ز پ

description

بنام خدا. داده كاوي و كاربرد آن در پزشكي. نام دانشجو : بابك رزاقي شماره دانشجويي : 85233510 استاد راهنما : جناب آقاي دكتر توحيد خواه (سمينار درس كاربرد فناوري اطلاعات در پزشكي). Why DATA MINING?. Necessity is mother of invention Huge amounts of data - PowerPoint PPT Presentation

Transcript of داده كاوي و كاربرد آن در پزشكي

Page 1: داده كاوي و كاربرد آن در پزشكي

داده كاوي و كاربرد آن در پزشكي

بنام خدا

نام دانشجو : بابك رزاقي شماره دانشجويي : 85233510

استاد راهنما : جناب آقاي دكتر توحيد خواه )سمينار درس كاربرد فناوري اطالعات در پزشكي(

Page 2: داده كاوي و كاربرد آن در پزشكي

Necessity is mother of invention Huge amounts of data Electronic records of our decisions

Choices in the supermarket Financial records Our comings and goings

We swipe our way through the world – every swipe is a record in a database

Data rich – but information poor Lying hidden in all this data is information! 2

Page 3: داده كاوي و كاربرد آن در پزشكي

3

Extracting or “mining” knowledge from large amounts of data

Data -driven discovery and modeling of hidden patterns in large volumes of data

Extraction of implicit, previously unknown and unexpected, potentially extremely useful information from data

Page 4: داده كاوي و كاربرد آن در پزشكي

4

Large database

Data mining

Data visualization

Ways of seeing patterns in large data sets Uses the efficiency of human pattern recognition

Page 5: داده كاوي و كاربرد آن در پزشكي

5

Gold Mining Knowledge mining from databases Knowledge extraction Data/pattern analysis Knowledge Discovery Databases or

KDD

Page 6: داده كاوي و كاربرد آن در پزشكي

6

______

______

______

Transformed Data

Patternsand

Rules

Target Data

Raw Data

KnowledgeData MiningTransformation

Interpretation& Evaluation

Selection& Cleaning

IntegrationUnderstanding

Knowledge Discovery Process

DATAWarehouse

Knowledge

Page 7: داده كاوي و كاربرد آن در پزشكي

7

Find true patterns and avoid overfitting (false patterns due to randomness)

Page 8: داده كاوي و كاربرد آن در پزشكي

8

Classification: predicting an item class Clustering: finding clusters in data Associations: e.g. A & B & C occur frequently Visualization: to facilitate human discovery Summarization: describing a group Estimation: predicting a continuous value Deviation Detection: finding changes Link Analysis: finding relationships

Page 9: داده كاوي و كاربرد آن در پزشكي

9

Computationally expensive to investigate all possibilities

Dealing with noise/missing information and errors in data

Choosing appropriate attributes/input representation

Finding the minimal attribute space Finding adequate evaluation function(s) Extracting meaningful information Not over fitting

Page 10: داده كاوي و كاربرد آن در پزشكي

10

INSIGHTFUL MINERAngoss Knowledge ACCESS ARMiner Eudaptics Viscovery Goal TV MDR

Viscovery SOMine

SPSS

Page 11: داده كاوي و كاربرد آن در پزشكي

11

Science: Chemistry, Physics Bioscience

Sequence-based analysis Protein structure and function prediction Protein family classification Microarray gene expression

Financial Industry - banks, businesses, e-commerce Stock and investment analysis

Pharmaceutical companies Health care Sports and Entertainment

Page 12: داده كاوي و كاربرد آن در پزشكي

Clinical Data Mining processes

Digital format for all pertinent data Create structure Obtain coded information Natural language understanding Create a widely accessible repository

12

Page 13: داده كاوي و كاربرد آن در پزشكي

13

Page 14: داده كاوي و كاربرد آن در پزشكي

Minimum systolic blood pressure over a 24-hour period following admission to the hospital

Class 2:

Early death

Age of Patient

Class 1:

Survivors

Was there sinus tachycardia?

Class 1:

Survivors

Class 2:

Early death

<= 91 > 91

<=62.5>62.5

YESNO

14

Page 15: داده كاوي و كاربرد آن در پزشكي

15

Page 16: داده كاوي و كاربرد آن در پزشكي

16

An organism’s genome is the “program” for making the organism, encoded in DNA Human DNA has about 30-35,000 genes A gene is a segment of DNA that specifies how

to make a protein Cells are different because of differential

gene expression About 40% of human genes are expressed at

one time Microarray devices measure gene expression

Page 17: داده كاوي و كاربرد آن در پزشكي

17

Gene ValueD26528_at 193D26561_cds1_at -70D26561_cds2_at 144D26561_cds3_at 33D26579_at 318D26598_at 1764D26599_at 1537D26600_at 1204D28114_at 707

Scanner

enlarged section of raw image

raw data

Page 18: داده كاوي و كاربرد آن در پزشكي

18

New and better molecular diagnostics New molecular targets for therapy

few new drugs, large pipeline, … Outcome depends on genetic signature

best treatment? Fundamental Biological Discovery

finding and refining biological pathways Personalized medicine ?!

Page 19: داده كاوي و كاربرد آن در پزشكي

19

Avoiding false positives, due to too few records (samples), usually < 100 too many columns (genes), usually > 1,000

Model needs to be robust in presence of noise

For reliability need large gene sets; for diagnostics or drug targets, need small gene sets

Estimate class probability Model needs to be explainable to biologists

Page 20: داده كاوي و كاربرد آن در پزشكي

20

Page 21: داده كاوي و كاربرد آن در پزشكي

21

Page 22: داده كاوي و كاربرد آن در پزشكي

22

Page 23: داده كاوي و كاربرد آن در پزشكي

23

Page 24: داده كاوي و كاربرد آن در پزشكي

24

Page 25: داده كاوي و كاربرد آن در پزشكي

25

Page 26: داده كاوي و كاربرد آن در پزشكي

26

Page 27: داده كاوي و كاربرد آن در پزشكي

27

Page 28: داده كاوي و كاربرد آن در پزشكي

28

Page 29: داده كاوي و كاربرد آن در پزشكي

29

Discover useful relationships in data Discover information otherwise overlooked Provide intelligence to improve various

phases Intellectual property Competitive advantages:

Getting more out of your data Finding other relevant information faster Exploratory, hypothesis-generating analyses

Increase productivity – reduced amount of time and money

Page 30: داده كاوي و كاربرد آن در پزشكي

30

Page 31: داده كاوي و كاربرد آن در پزشكي

31

Thank You [email protected]