Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents...

42
Montagne Sainte Geneviève Plateforme Génomique http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011 Stéphane Le Crom ([email protected]) Institut de Biologie de l’École normale supérieure (IBENS) Plateforme Génomique de la Montagne Sainte Geneviève Atelier Epigénétique Université Pierre et Marie Curie Le séquençage à haut débit Mars 2011

Transcript of Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents...

Page 1: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

Stéphane Le Crom ([email protected])

Institut de Biologie de l’École normale supérieure (IBENS) Plateforme Génomique de la Montagne Sainte Geneviève

Atelier Epigénétique Université Pierre et Marie Curie

Le séquençage à haut débit Mars 2011

Page 2: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

Le séquençage par la méthode Sanger

• Méthode par synthèse enzymatique inventée en 1977 par Frédérick Sanger (Angleterre, nobel de Chimie 1980).

• Initiation de la polymérisation de l’ADN à l'aide d'une amorce complémentaire.

• Élongation de l’amorce par des ADN polymérases thermostables (PCR).

• Addition des quatre désoxyribonucléotides (dATP, dCTP, dGTP, dTTP) et d’une faible concentration de l'un des quatre didésoxynucléotides (ddATP, ddCTP, ddGTP ou ddTTP).

• Ces ddNTP une fois incorporés dans le nouveau brin synthétisé, empêchent la poursuite de l’élongation. La terminaison se fait de manière statistique sur toutes les positions possibles.

D’après The Scientist

Page 3: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

Lecture de la séquence

• On obtient un mélange de fragments d’ADN de tailles croissantes qui se terminent tous au niveau d'une des bases dans la séquence.

• Ces fragments sont séparés par électrophorèse sur gel de polyacrylamide.

• La détection des fragments synthétisés se fait en incorporant un traceur dans l'ADN synthétisé.

• Initialement ce traceur était radioactif, attachés soit à l'oligonucléotide, soit au didésoxyribonucléotide.

• Environ 1 kb d’ADN par lecture en 6-8 heures. Une lecture par échantillon.

A C G T Du plus grand

Au plus petit

Page 4: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

Les séquenceurs à capillaires

• Les séquenceurs capillaires sont apparus dans les années 90 grâce au remplacement du marqueur radioactif par un marqueur fluorescent.

• Utilisation des tubes capillaires de verre de seulement quelques microns de diamètre, sur plusieurs dizaines de centimètres de longueur (30 à 50 cm), pour séparer l'ADN durant l'électrophorèse.

• Les quatre nucléotides passent dans le même tube capillaire à l’aide de quatre marqueurs fluorescents différents.

• 300 kb d’ADN par lecture en 3 heures. Un grand nombre d’échantillons en parallèle.

Page 5: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

Les nouvelles méthodes de séquençage à haut débit

Page 6: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

Historique des technologies en présence

• Principe : obtention de séquences courtes en très grand nombre.

• Roche : 454 GS FLX

• Illumina/Solexa : Genome Analyzer

• Applied Biosystems : SOLiD

Page 7: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

La technologie 454 (préparation)

• Fractionnement aléatoire de l’ADN de l’échantillon à analyser en morceaux de 300 à 800 pb pour obtenir une banque d’ADN simple brin matrice.

• Préparation en ajoutant des adaptateurs spécifiques des extrémités 3' et 5’.

• Immobilisation de chaque brin sur une bille. Un fragment d’ADN = une bille.

• Émulsion des billes avec les produits d’amplification dans un mélange eau-huile. Création de microréacteurs contenant une seule bille.

• PCR en émulsion. Amplification de chaque séquence dans son microréacteur. Amplification de toute la banque en parallèle. Plusieurs millions de copies par bille.

Mardis (2008) Trends Genet.

Page 8: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

La technologie 454 (séquençage)

• Purification et chargement des fragments sur plaque. Le diamètre des puits ne permet qu’une seule bille à la fois.

• Ajout des enzymes de séquençage et envoi des nucléotides individuels les uns après les autres.

• Les bases complémentaires du brin matrice s’ajoutent une ou plusieurs à la fois.

• Le signal chimie luminescent est enregistré par une caméra CCD.

• Séquençage par synthèse avec émission de lumière, on parle de pyroséquençage.

Mardis (2008) Trends Genet.

Page 9: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

La technologie 454 (lecture)

• La lecture est effectuée en simultanée sur plusieurs bases incorporées. Le « flowgram » est alors lu pour obtenir la séquence.

• On obtient : - 400 000 lectures ; - chacune de 250 bases ; - 100 Mb par run.

• Les erreurs majeures de séquences proviennent avec cette méthode des homopolymères.

http://www.454.com/

Page 10: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

La technologie Illumina/Solexa (préparation)

• Génération d’une banque d’ADN double brin à partir de l’échantillon à analyser par fractionnement aléatoire en morceaux de 200 pb.

• Ajout d’adaptateurs spécifiques aux extrémités.

• Dénaturation de l’ADN en simple brin.

• Fixation de l’extrémité des simples brins aléatoirement à la surface du « flowcell ».

• PCR « bridge » en phase solide. Création d’un double brin. Dénaturation et création de groupes (clusters) denses où les fragments sont amplifiés.

http://www.illumina.com/

Page 11: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

La technologie Illumina/Solexa (séquençage)

• Le premier cycle de séquençage commence en ajoutant les 4 terminateurs réversibles marqués, les amorces et l’ADN polymérase.

• Après excitation par un laser, la fluorescence émise par chaque cluster est récupérée et la première base est lue.

• Le cycle suivant continue en ajoutant les 4 terminateurs réversibles marqués.

• Après excitation l’image est acquise de la même façon et la deuxième base est lue.

• Les cycles de séquences sont répétés pour lire chaque base les unes après les autres.

http://www.illumina.com/

Vidéo présentation Illumina/Solexa

Page 12: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

La technologie Illumina/Solexa (lecture)

• La lecture est effectuée à chaque position sur toutes les séquences en parallèle.

• On obtient : - 45 000 000 de lectures ; - chacune de 36 bases ; - 1 Gb par run.

• Les erreurs majeures de séquences proviennent d’erreur de séquençage (99%)

http://www.illumina.com/

Page 13: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

La technologie SOLiD (préparation)

• Fabrication de deux types de banque : classique ou « mate-paired ».

• Ajout d’adaptateurs.

• PCR par émulsion comme dans la méthode 454.

• Enrichissement des billes amplifiées.

• Modification en 3’ pour permettre la fixation covalente sur une lame.

• Dépôts des billes sur la lame qui peut-être séparée en chambres.

http://www3.appliedbiosystems.com/AB_Home/applicationstechnologies/SOLiDSystemSequencing/

Page 14: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

La technologie SOLiD (séquençage)

• Séquençage par ligation.

• Des amorces s’hybrident sur les adaptateurs présents sur la matrice.

• Un jeu de 4 sondes de 2 bases marquées en fluorescence sont associées aux amorces.

• La spécificité des sondes de 2 bases s’effectue avec les 1ère et 2nd bases de chaque réaction de ligation.

• Plusieurs cycles de ligation, détection et clivages sont effectués.

• Les produits d’extension sont retirés et une nouvelle amorce complémentaire de la positon n-1 est utilisée pour un second tour de ligations.

http://www3.appliedbiosystems.com/AB_Home/applicationstechnologies/SOLiDSystemSequencing/

Page 15: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

La technologie SOLiD (séquençage)

• Cinq tours de remise à zéro des amorces sont effectués pour chaque séquence.

• À chaque nouvelle mise à jour le primer utilisé interroge la position n-1.

• Dans ce processus chaque base est interrogée dans deux réactions de ligation indépendantes par deux différentes amorces.

• Par exemple la base en position 5 est mesurée par l’amorce 2 dans le cycle de ligation 2 et par l’amorce 3 dans le cycle de ligation 1.

http://www3.appliedbiosystems.com/AB_Home/applicationstechnologies/SOLiDSystemSequencing/

Vidéo présentation SOLiD

Page 16: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

La technologie SOLiD (séquençage)

• Le codage des résultats est effectué sur 2 bases dans un espace de 4 couleurs.

• La lecture des séquences est effectuée dans un espace de couleur.

• À partir du moment où l’on connaît la première base, la conversion de l’espace des couleurs vers celui des bases est possible.

• La séquence de référence est codée dans l’espace de couleur. L’alignement et la séquence consensus sont aussi effectués dans cet espace.

http://www3.appliedbiosystems.com/AB_Home/applicationstechnologies/SOLiDSystemSequencing/

Page 17: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

La technologie SOLiD (lecture)

• Le système de codage de la lecture sur deux bases permet une très grande fidélité de la lecture des résultats.

• Avec ce système on peut faire la différence entre les erreurs de séquençages et les variants réels (SNP, insertions et délétions).

• On obtient : - 80 000 000 de lectures ; - chacune de 30 bases ; - 3 Gb par run.

• Le système de codage dans l’espace de couleur rend l’analyse informatique relativement complexe.

Mardis (2008) Trends Genet.

Page 18: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

Comparaison des différentes technologies

Mardis (2008) Trends Genet. Et http://www.agencourt.com/services/nextgen/

Page 19: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

Les améliorations actuelles

• Augmentation de la densité des éléments (puits, clusters, billes).

• Utilisation du système « paired-end tags » (PET) ou « mate-pair ».

• Amélioration des logiciels de détections.

Fullwood (2009) Genome Res.

Page 20: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

Comparaison des dernières générations

454 GS FLX SOLiD 5500XL HiSeq 2000 Run Time 10 heures 14 jours 8 jours

Taille des lectures (pb) 1000 2x 75 2x 100

Nombre de lectures 1 106 1,4 109 1 109

Données générées 1 Gb 300 Gb 200 Gb

Débit 1 Gb/jour 15 Gb/jour 25 Gb/jour

Page 21: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

L’évolution des technologies de séquençage

Stratton (2009) Nature

Page 22: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

L’évolution des technologies de séquençage

Stratton (2009) Nature

109

1010

108

107

106

105

104

103

Coû

t du

séqu

ença

ge d

u gé

nom

e hu

mai

n (e

n $)

Page 23: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

Les prochaines générations

Page 24: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

Le séquençage en temps réel

• Technologie de séquençage en temps réel sur molécule unique grâce à l’immobilisation au fond d’un puits d’une molécule d’ADN polymérase.

• L’incorporation de chaque base associée à un fluorochrome est mesuré en temps réel grâce à une caméra CDD placée sous la plaque support.

Eid (2009) Science

Page 25: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

Pacific Biosciences

Vidéo de présentation de Pacific Biosciences http://www.pacificbiosciences.com/

Page 26: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

Les applications

Page 27: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

Elles recouvrent les techniques précédentes

Kahvejian et al. (2008) Nat. Biotech.

Page 28: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

Elles peuvent se regrouper en 2 catégories

Rothberg et Leamon (2008) Nat. Biotech.

Page 29: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

Le séquençage de novo

• Les nouvelles technologies permettent de séquencer plus vite et pour moins cher qu’avec la méthode de Sanger.

• Seulement les lectures sont plus petites et chaque méthode à ses propres limites.

• La combinaison de plusieurs méthodes différentes permet pour de petits génomes d’obtenir des brouillons de bonne qualité.

=> Combinaison 454 et Illumina.

• Taux d’erreur faible et couverture uniforme car absence des biais introduits par le clonage dans la méthode Sanger.

• Les erreurs sont différentes entre les deux méthodes.

Aury et al. (2008) BMC Genomics

Page 30: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

Les applications de reséquençage

• Leurs buts : analyser différents génomes en les comparant à une souche de référence.

• Recherche de polymorphismes dans une population, d’identification de mutations en biotechnologie, d’analyse d’évolution d’organismes, de différenciation d’une cellule au cours du temps, de la découverte d’ADN anciens …

• Métagénomique : caractériser les différents génomes présents dans un échantillon.

• Le champs des applications de cette approche est important : caractériser les micro-organismes pathogènes présents chez un patient (sang, tissus, …), définir l’ensemble des espèces présents dans l’environnement (écologie, dépollution, …), comprendre l’évolution des espèces, …

http://www.jgi.doe.gov/News/lake_washington_microbes.jpg

Page 31: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

Les applications fonctionnelles

Wold et al. (2008) Nat. Methods

Page 32: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

Les applications sont très nombreuses …

Shendure et Ji (2008) Nat. Biotech.

Page 33: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

Le traitement informatique

Page 34: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

L’analyse des données

Page 35: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

L’analyse des données

• L’obtention de données en très grand nombre nécessite la mobilisation de ressources informatiques importantes.

• Les systèmes d’analyse produisent des To de données à chaque expérience (nombreuses images à forte résolution).

• Les seuls fichiers de résultats prennent beaucoup d’espace (4Go compressé avec Illumina) empêchant les transferts par le réseau de façon efficace.

• L’alignement des lectures sur les génomes de grande taille demande beaucoup de mémoire vive et de temps de calcul.

http://www.geospiza.com/finchtalk/labels/Next Generation Sequencing.html

Page 36: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

Les nouvelles technologies de séquençage • Avantages

• Pas de sous-clonage ni d’utilisation de bactérie comme hôte :

- plus de biais ; - banques plus simples.

• Chaque séquence provient d’une molécule d’ADN unique :

- quantification ; - gamme dynamique plus grande.

• Résolution importante pour un très grand nombre de types d’expériences différentes.

• Amélioration considérable dans la vitesse et dans le coût comparé à la méthode de Sanger.

• Inconvénients

• Les séquences obtenues sont plus courtes :

- par rapport à Sanger ; - paramètres du « base calling » ; - analyses bioinfo à repenser.

• La quantité de données générées pose de vrai problème d’informatique :

- plusieurs To par run ; - utilisation de temps CPU ; - Choisir ce qui doit être archivé.

• La technologie évolue sans cesse ce qui pose des problèmes pour l’amortissement des appareils.

• La fabrication des banques n’est pas une étape si simple.

Page 37: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

Quel avenir pour les puces à ADN ?

Page 38: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

Les puces à ADN vont elles disparaître ?

• Les applications du séquençage recouvrent celles des puces à ADN.

• La technologie est plus sensible pour détecter les gènes faiblement exprimés. La gamme dynamique est plus large (pas de saturation).

• Elle est plus précise, plus rapide et moins couteuse pour détecter les SNP dans de grands génomes.

• Les puces à ADN nécessitent de connaître la séquence à analyser.

Ledford (2008) Nature et Shendure (2008) Nat. Methods

Page 39: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

A complémentaire de T G complémentaire de C

Deux séquences complémentaires peuvent s’apparier (hybrider).

L’hybridation est influencée par de nombreux paramètres : • Spécificité (cross-hybridation) • Sensibilité (Tm, structure secondaire, …) • Séquences choisies (taille, composition)

Certains paramètres peuvent être contrôlés par la stringence du milieu d’hybridation (température, concentration saline et présence d’agents déstabilisant les liaisons H comme la formamide).

Le séquençage s’affranchit de l’hybridation

Page 40: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

Comparaison des forces en présence

Wang et al. (2009) Nat. Rev. Genet.

Page 41: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011

Des applications dédiées

• Les puces à ADN vont de plus en plus se tournées vers des applications de diagnostique ou de criblage.

• On peut imaginer avec le couplage de l’hybridation et de l’analyse en temps réel que des solutions rapides et mobiles seront disponibles dans le futur.

• L’augmentation de la densité et surtout du multiplexage va permettre de diminuer le coût de chaque hybridation (moins de 100 euros).

• Des applications de capture pour ensuite séquencer sont aussi en cours de validation.

Page 42: Montagne Sainte Geneviève - sorbonne-universite.frgenetique.snv.jussieu.fr/OLD SITE/Documents 2011/Epigenetique 2011... · Montagne Sainte Geneviève Plateforme Génomique Atelier

Montagne Sainte Geneviève Plateforme Génomique

http://transcriptome.ens.fr Atelier Épigénétique, UPMC, Mars 2011