Métodos y estrategias de secuenciamiento de alto rendimiento. Aplicaciones

Post on 20-Jun-2015

2.212 views 2 download

Tags:

description

Presentación: "Métodos y estrategias de secuenciamiento de alto rendimiento. Aplicaciones" en el Curso Básico y Taller de PCR en Tiempo Real. HIGA Rossi La Plata, 22 y 23 de Noviembre, 2012. Organiza: Laboratorio de Virología y Biología Molecular H.I.G.A. R. Rossi - La Plata. Auspicia: Servicio de Docencia e Investigación - HIGA Rossi La Plata y Comunidad Vita - Biocientífica S.A.

Transcript of Métodos y estrategias de secuenciamiento de alto rendimiento. Aplicaciones

Métodos y estrategias de secuenciamiento de alto rendimiento.Aplicaciones.

Curso Hospital Rossi 2012

Instituto de tecnologíay Biología Molecular

Facultad de Ciencias Exactas - Universidad Nacional de La Plata

DNA RNA

Translation Growth of NA Sequencing

Highthrougput techniques in structural and functional biology

DNA enzimology - structure RNA enzymologyProtein biochemistry Protein structure

Pre-genomic descoveries Formal arrival of genomics

Devising the post genomic

Instituto de Biotecnología y Biología Molecular

Facultad de Ciencias Exactas - Universidad Nacional de La Plata

Secuenciamiento de Sanger :

separación y detectión de

polinucleótidos fluorescentes

Instituto de Biotecnología y Biología Molecular

Facultad de Ciencias Exactas - Universidad Nacional de La Plata

1977; Fred Sanger; fX 174 bacteriophage; 5,375 ntConcept of ORF as coding regionAmino acid sequence of phage proteinsOverlapping genes [Figure 24-1] only in viruses

1995; Craig Venter & Hamilton Smith;Haemophilus influenzae (1,830,137 nt) (1st free living)Mycoplasma genitalium (smallest free-living, 580,000 nt; 470 genes)

1996; Saccharomyces cerevisiae; (1st eukaryote) 12,068,000 nt1997; Escherichia coli; 4,639,221 nt; Genetically more important

Many firsts followed1999; Human chromosome 22; 53,000,000 nt2000; Drosophila melanogaster; 180,000,000 nt2001; Human; working draft; 3,200,000,000 nt

2010; hundreds of genomes

De 265 a 350 genes definen la vida celular [Hutchison III, C. A., et al. (1999). Science, 286: 2165-2169].

En términos genómicos,¿Cuántos/qué genes sustentan es la vida ?

Arqueología Molecular

Biofertilizantes.Biotipificación.

Bioinsecticidas.Biorremediación. .

Herbicidas. Biodegradación de la celulosa.

Producción de etanol. Producción de aminoácidos.

Biodeterioro. Producción de antibióticos.

Producción de antifungicos. Fermentaciones.

Producción de vacunas.Farmacogenómica

Terapia génica.Mejoramiento genético de especies.

Enzimas microbianas. Biodegradación de desechos tóxicos.

Uso de microorganismos en la recuperación de minerales. Recuperación de especies.

Alimentos a partir de microorganismos.Proteína de origen unicelular.

Bioindicadores ambientales.Epidemiología

Diagnóstico

¿Para que sirve la genomica en términos prácticos?

Además de contribuir al conocimiento íntimo de la

bioquímica de los seres vivos,

Instituto de Biotecnología y Biología Molecular

Facultad de Ciencias Exactas - Universidad Nacional de La Plata

“ … And God said, Let there be light:

and there was light …”.(Genesis 1, 3)

Pyrosequencing

-El primer genoma bacteriano fue secuenciado en 1995 (Sanger), draft del genoma humano en el año 2001.

1995 - 2012

- En 2005, aparecen el primer equipo con alta capacidad de secuenciación.

- La capacidad de secuenciamiento se ha duplicado cada 6-9 meses.

- Obtener datos de secuencia del tamaño de un genoma humano tiene un costo cercano a los U$S 1000 (¿U$S 1 para el genoma de una bacteria?).

Variantes tecnológicas actuales para el secuenciamiento de alta capacidad:

I. Secuenciamiento de moldes amplificados clonalmente (emPCR, otros).

II. Secuenciamiento de moléculas individuales (single-molecule sequencing).

Etapas experimentales del secuenciamiento de alta capacidad:

i) Preparación de una biblioteca de fragmentos de ADN (fragmentos de 150 pb- 800 pb). Para la generación de fragmentos puede usarse:

(ii) Amplificación (clonal), para las tecnología que corresponda

iii) Secuenciamiento

I. Secuenciamiento de moldes amplificados clonalmente.

i) Preparación de una biblioteca de fragmentos de ADN (150 - 800 pb)

Para la generación de fragmentos puede usarse:

A) MÉTODOS MECÁNICOS.

A1) nebulización (simple, pérdidas grandes de material, amplio rango de fragmentos, riesgo de contaminación cruzada, no es adecuada para procesamiento paralelo)A2) ultrasonido (minimiza la manipulación y pérdida de muestra, permite el procesamiento paralelo, alto costo).

B) MÉTODOS ENZIMÁTICOS.

b1) Fragmentasa (mezcla de nucleasas)b2) Tagmentación (basado en el uso de transposasas)

Para ayudar al armado de scafolds y obtener moléculas circulares todas las plataformas que usan métodos de amplificación que soportan mate pair sequencing (3 kb, 6 Kb, 8 kb, o 20 kb).Todas las plataformas pueden procesar productos de PCR permitiendo incorporar secuencias adaptadoras en el extremo 5’ de los cebadores.

ii) Amplificación (clonal).

Los moldes se inmovilizan en un soporte sólido y las moléculas individuales se

amplifican (106-109 veces) de modo clonal, separadas espacialmente para su

secuenciamiento masivo en paralelo. Para las plataformas ilúmina la amplificación

esta automatizada (con o sin equipo accesorio) y no requiere PCR.

iii) Secuenciamiento.

Todas las plataformas usan secuenciamiento por síntesis.

Illumina: Emplea la química Solexa con terminación reversible. Mezcla de dNTPs fluorescentes con el extremo 3’-OH protegido.

454 y Ion Torrent: No usan terminadores, dNTP individuales en cada ciclo de reacción, se detectan el PPi (454) o los protones liberados (Ion Torrent), respectivamente.La plataforma Ion Torrent es el primer instrumento de secuenciación de la era “post-light”.

SOLiD: Emplea probes fluorescentes que se usan de modo iterativo en etapas de hibridación y ligación al extremo 5’ de la cadena en crecimiento.

Material de entrada requerido: nanogramos – 10 µg.Requerimiento de un fluorómetro, o equipo equivalente, para cuantificar DNA de doble hebra.

Instituto de Bioquímica y Biología Molecular

Facultad de Ciencias Exactas - Universidad Nacional de La Plata

The advantages of moder n sequencing techniques

- Low amount of DNA required.- highthroughput technique (compared to the Sanger method-based plataforms).-- useful in metagenomic studies (i.e. analysis of DNA samples from deep- see organisms).- powerful to approach the DNA sequencing from tissues samples of extinct organisms (i.e. mammoth DNA).

II. Secuenciamiento de moléculas individuales.

Se independiza de la preparación de bibliotecas y de los artefactos de la

amplificación. El equipo Heliscope de Helicos Biosciences utiliza

secuenciamiento reversible con terminadores de un color sobre moléculas

individuales (¿equipo discontinuado?). Recientemente Pacific Biosciences

presentó un equipo de secuenciamiento en tiempo real en el que los

nucleótidos marcados se incorporan a la cadena en crecimiento con la

polimerasa del fago phi-29.

Tipos de instrumentos, características más relevantes:

A) High-end instruments (grandes): requieren cientos a miles de dólares para su puesta en marcha. Adecuados para grandes centros de secuenciamiento o de servicios (core-facilities).Procesan docenas a miles de genomas bacterianos por corrida.Requieren bar-coding y multiplexing de las muestras con subdivisión de las corridas.

B) Bench-top intstruments (de mesada): Existen actualmente 3 modelos,

b1) 454 GS Junior (Roche)

b2) Ion PGM

b3) MiSeq (Illumina)

Cada uno de estos instrumentos puede secuenciar genomas bacterianos completos en días. Todos generan secuencias genómicas crudas (draft) con ensambles que usualmente cubren/mapean el 95% del genoma. Ningún instrumento fue capaz de generar un contigo por replicón que equivaldría a obtener los genomas terminados.

Instituto de Biotecnología y Biología Molecular

Facultad de Ciencias Exactas - Universidad Nacional de La Plata

Hybrid approaches to achive better draft genome assemblies

pros -vs- cons de cada instrumento:

MiSec: mostró la mayor capacidad de secuenciamiento por corrida, la menor tasa de error, y el flujo de trabajo más amigable.

454 GS Junior: produjo las lecturas más largas (promedio 592 bases), los contigs menos fragmentados pero tuvo el menor rendimiento y mayor costo por base (1 orden de magnitud respecto del resto).

Ion PGM: mostró la mayor capacidad de procesamiento por hora (80 a 100 megabases) y los menores tiempos de corrida ( cerca de 3 horas), las lecturas más cortas (promedio 121 bases, aunque puede extenderse hasta 200 con un kit especial).

Ion PGM y 454 GS Junior fueron propensos a cometer errores en regiones homopoliméricas resultandoen cambios en el marco de lectura de regiones codificantes (aun con datos de alta cobertura).

Instituto de Bioquímica y Biología Molecular

Facultad de Ciencias Exactas - Universidad Nacional de La Plata

The overall reaction from polymerization to light detection takes place within 3-4 sec at room temperature. One pmol of DNA in a pyrosequencing reaction yields 6 × 1011 ATP molecules which, in turn, generate more than 6 × 109 photons at a wavelength of 560 nanometers. This amount of light is easily detected by a photodiode, photomultiplier tube, or a charge-coupled device camera (CCD) camera.

Instituto de Bioquímica y Biología Molecular

Facultad de Ciencias Exactas - Universidad Nacional de La Plata

Instituto de Bioquímica y Biología Molecular

Facultad de Ciencias Exactas - Universidad Nacional de La Plata

Instituto de Bioquímica y Biología Molecular

Facultad de Ciencias Exactas - Universidad Nacional de La Plata

> 20 Mb / single run

Instituto de Bioquímica y Biología Molecular

Facultad de Ciencias Exactas - Universidad Nacional de La Plata

Instituto de Bioquímica y Biología Molecular

Facultad de Ciencias Exactas - Universidad Nacional de La Plata