Giacomo Veneri Thesis

23
Sistema per l’identificazione automatica di gruppi proteici nelle immagini elettroforetiche bidimensionali Prof. Alessandro Prof. Alessandro Mecocci Mecocci Ing. Paolo Bussotti Ing. Paolo Bussotti Giacomo Veneri Giacomo Veneri

description

In proteomics, two dimensional gel electrophoresis (2–DE) is a separation technique for proteins. Gel electrophoresis is registered and the final digital image is computer analyzed for protein spots finding; the protein spots can be detected by visual inspection of a digital gel image or by image processing algorithm. On computer image analysis, difficulties arise from image noise, spot saturation and irregular geometric distortions. Aiming at the automated analysis of large series of 2–DE images, the bottleneck is to solve the two most basic algorithmic problems: identifying protein spots and computing the protein spots map in order to compare it to database or different image. We developed a robust Analysis of Variance (ANOVA) based algorithm able to excite spot in order to be easy found and separated by classic algorithm as edge detection or watershed. The implementation is done in a client standalone application called VisualBio.

Transcript of Giacomo Veneri Thesis

Page 1: Giacomo Veneri Thesis

Sistema per l’identificazione automatica di gruppi proteici

nelle immagini elettroforetiche bidimensionali

Prof. Alessandro MecocciProf. Alessandro Mecocci

Ing. Paolo BussottiIng. Paolo Bussotti Giacomo VeneriGiacomo Veneri

Page 2: Giacomo Veneri Thesis

Processo elettroforetico

Spot matchingGel preparation

Classification

Person

Person

Person

Person

Spot classification

A11

AqR

A11

A17

Mel1AQS

A11Z1X

A11

AqR

A11

A17

Mel1AQS

A11Z1X

(1)(2)

(3)

(4)

Page 3: Giacomo Veneri Thesis

Gel Elettroforetico

Peso Molecolare

Punto isoelettrico

Problemi nel gelProblemi nel gel

•Streaks :rumore correlato

•Saturazione grigi

•Spot overlapping

Problemi nel gelProblemi nel gel

•Streaks :rumore correlato

•Saturazione grigi

•Spot overlapping

EterogeneitàEterogeneitàEterogeneitàEterogeneità

AffidabilitàAffidabilitàAffidabilitàAffidabilità

Page 4: Giacomo Veneri Thesis

Informazioni note a priori

Spot = Distribuzione GaussianaSpot = Distribuzione GaussianaSpot = Distribuzione GaussianaSpot = Distribuzione Gaussiana

Spot Grandi = Spot MarcatiSpot Grandi = Spot MarcatiSpot Grandi = Spot MarcatiSpot Grandi = Spot Marcati

Streaks costanti lungo le YStreaks costanti lungo le YStreaks costanti lungo le YStreaks costanti lungo le Y

Page 5: Giacomo Veneri Thesis

Scopo

1. 1. Preelaborazione: Preelaborazione: Rimozione delle streaksRimozione delle streaks

1.a Massima Rimozione1.a Massima Rimozione

1.b Minima perdita1.b Minima perdita

2. 2. Spot Matching: Spot Matching: individuazione degli spotsindividuazione degli spots

2.a Risoluzione dello spot overlapping2.a Risoluzione dello spot overlapping

2.b Estrazione degli spots dalle streaks2.b Estrazione degli spots dalle streaks

2.c Massima sensibilità verso gli spots più piccoli2.c Massima sensibilità verso gli spots più piccoli

WatershedWatershed

GeodesicGeodesic

Anova CWAnova CW

SnakeSnake

FFTFFT

MinimumMinimum

Page 6: Giacomo Veneri Thesis

FFTFFT

Page 7: Giacomo Veneri Thesis

FFTFFT

Elimina le streaks

Mantiene intatti gli edge

Data l’eterogeneità del gel si richiede un algoritmo più leggero

Page 8: Giacomo Veneri Thesis

MinMin

Page 9: Giacomo Veneri Thesis

MinMin

Page 10: Giacomo Veneri Thesis

Perdita minimaPerdita minima

MinMin

Elimina in modo efficiente le streaks

Mantiene intatti gli spots più piccoli

Elimina lo sfondo

Page 11: Giacomo Veneri Thesis

Profilo

Page 12: Giacomo Veneri Thesis

Riconoscimento degli Spot

WatershedWatershedDigaDiga

Spot overlapping a sopraffazioneSpot overlapping a sopraffazione

•Thresholding ai vari livelli

• Se il livello superiore contiene due insiemi viene eratta una diga

•Thresholding ai vari livelli

• Se il livello superiore contiene due insiemi viene eratta una diga

spotsspots

Page 13: Giacomo Veneri Thesis

Watershed Segmentazione delle streaks

Risolve lo spot overlapping

Non risolve lo spot overlapping a sopraffazione

Segmenta le streaks e descrive male i contorni

Page 14: Giacomo Veneri Thesis

Geodesic

Max. descrizione dei contorni

Page 15: Giacomo Veneri Thesis

Sensitività massima

GeodesicGeodesic

Risolve lo spot overlapping

Non risolve lo spot overlapping a sopraffazione

Descrive efficientemente i contorni estraendo gli spots dalle streaks

Page 16: Giacomo Veneri Thesis

Cartesiane

Polari

n

i

m

jjij

m

jj

mnyy

myyn

F

1 1

2.

1

2...

))1(/()(

)1/()(

n

i

m

jjij

m

jj

mnyy

myyn

F

1 1

2.

1

2...

))1(/()(

)1/()(

Riconoscimento degli Spot Riconoscimento degli Spot Anova CWAnova CW

Ogni pixel (x,y)

Ogni pixel (x,y)

Probabiltà che in (x,y) sia centrato uno spot

Probabiltà che in (x,y) sia centrato uno spot

mjH

ey

j

ijjij

..10:0

mjH

ey

j

ijjij

..10:0

Page 17: Giacomo Veneri Thesis

Riconoscimento degli Spot Riconoscimento degli Spot Anova CW con Maschera adattivaAnova CW con Maschera adattiva

Come scegliere R?Come scegliere R?

Adattivo con il livello di grigio del centro (x,y)Adattivo con il livello di grigio del centro (x,y)

R=50 log(0.31 I(x,y))R=50 log(0.31 I(x,y))

Adattivo con il livello di grigio del centro (x,y)Adattivo con il livello di grigio del centro (x,y)

R=50 log(0.31 I(x,y))R=50 log(0.31 I(x,y))

Page 18: Giacomo Veneri Thesis

Anova CW + Edge Anova CW + Edge LogLog

Spot overlapping a sopraffazione

WatershedWatershed

Anova CWAnova CWAnova CWAnova CW

Page 19: Giacomo Veneri Thesis

Anova CW + Anova CW + watershedwatershed

Risolve lo spot overlapping

Risolve lo spot overlapping a sopraffazione

Descrive efficientemente i contorni

Tempi più lunghi

Page 20: Giacomo Veneri Thesis

Gellab II +Melanie

VComputPhoretix

Confronto con altro software

Migliore descrizione dei contorniMigliore descrizione dei contorniMigliore descrizione dei contorniMigliore descrizione dei contorni

Nessuna perdita (99.6%)Nessuna perdita (99.6%)Nessuna perdita (99.6%)Nessuna perdita (99.6%)

Maggior tempo di elaborazioneMaggior tempo di elaborazioneMaggior tempo di elaborazioneMaggior tempo di elaborazione

Page 21: Giacomo Veneri Thesis

Visual Bio1 Background

2 Rest Sat.

3 Rest FFT

4 Rest Min

5 Edge Mask

6 Edge LoG

7 Watershed

8 Snake

9 Anova CW

10 Geodesic

E Equalize

1 Background

2 Rest Sat.

3 Rest FFT

4 Rest Min

5 Edge Mask

6 Edge LoG

7 Watershed

8 Snake

9 Anova CW

10 Geodesic

E Equalize

Page 22: Giacomo Veneri Thesis

Sviluppi Futuri

• Incremento Incremento velocità velocità ottimizzando il codiceottimizzando il codice

• Creazione di un Creazione di un software professionalesoftware professionale

•ClassificazioneClassificazione degli spots degli spots

• Comunicazione di Comunicazione di nuovi spotsnuovi spots mai classificato mai classificato

• Classificazione del gelClassificazione del gel

• Ricerca di Ricerca di nuove configurazioninuove configurazioni sfruttando sfruttando algoritmi geneticialgoritmi genetici

• Incremento Incremento velocità velocità ottimizzando il codiceottimizzando il codice

• Creazione di un Creazione di un software professionalesoftware professionale

•ClassificazioneClassificazione degli spots degli spots

• Comunicazione di Comunicazione di nuovi spotsnuovi spots mai classificato mai classificato

• Classificazione del gelClassificazione del gel

• Ricerca di Ricerca di nuove configurazioninuove configurazioni sfruttando sfruttando algoritmi geneticialgoritmi genetici

Page 23: Giacomo Veneri Thesis

Creazione del gel

EyEy

t2t2

ExEx

t1t1

Punto isoelettrico

Peso molecolare