UNA VISIÓN GLOBAL DELHAPMAP PROJECT UNA VISIÓN GLOBAL DEL HAPMAP PROJECT.

UNA VISIÓN GLOBAL DELUNA VISIÓN GLOBAL DEL HAPMAP PROJECTHAPMAP PROJECT

Variación genoma humano(1 variación / 1000 bp)

Variación población humana mundial(1 variación / 300 bp)

SNPs 90% variación en la población10% otras variaciones poco comunes en la población

0,1% sitios nucleotídicos

10 millones sitios nucleotídicos

2 alelos → frecuencia ≥ 1%

Human Genome Project Similitudes

HapMap Project Diferencias

99,9% del genoma

0,1% del genoma

VARIACIÓN EN LA SECUENCIA HUMANA DE DNA

VARIACIÓN EN LA SECUENCIA HUMANA DE DNA

Tasa de mutación = 10-8 /sitio/generación

Nº generaciones ancestro común-humano actual: 104-105

CONSORCIO INTERNACIONAL HAPMAP● Primer encuentro: Julio 2001

– Desarrollo del plan científico

– Elección de las poblaciones

– Discusión de las cuestiones éticas

– Inicio formal del proyecto: Octubre 2002

● Determinación grupos participantes

● Asignación de trabajo a cada grupo

● Fuentes de ayuda económica

Identificar patrones de variación genética y crear una base de datos pública y gratuita.

Descubrir factores genéticos de susceptibilidad a determinadas enfermedades. No establece conexiones entre variantes particulares y enfermedades. Aspectos básicos sobre hotspots de recombinación, bloques de DL y haplotipos. Nuevos aspectos sobre la variación estructural y la recombinación e identifica loci que

han estado sujetos a la selección natural durante la evolución humana.

FASE I

HAPMAP PROJECTFASE II

2,1 millones de nuevos SNPs Mejora la selección de tag SNPs Nuevos aspectos sobre las estructuras DL Mejora la resolución del mapa genético y la localización de los hotspots

Country Role Chromosomes

Japan 2 25,1% 5, 11, 14, 15, 16, 17, 19

UK 3 Genotipación y análisis 24,0% 1, 6, 10, 13, 20

Canadá 1 Genotipación 10,0% 2, 4p

China 5 10,0% 3, 8p, 21

US 6 30,9% 8p, 9, 18q, 22, X, 4q, 7q, 18p, Y, 12, 7p

Nigeria 2 Centro de cordinación de datos ----- -------------

Nº research groups

Per cent genome

Genotipación, análisis, muestras, consultas públicas

Genotipación, muestras, compromiso comunitario

Genotipación, muestras, compromiso comunitario

GRUPOS PARTICIPANTES

Japan (JPT) 44 muestras Individuos no relacionados

China (CHB) 45 muestras Individuos no relacionados

Total 89 muestras Individuos no relacionados

US (CEU) 90 muestras 30 trios (2 padres + 1 hijo adulto)

Nigeria (YRI) 90 muestras 30 trios (2 padres + 1 hijo adulto)

Total 180 muestras 60 trios

MUESTRAS DE DNA Y POBLACIONES

CHB + JPT: frecuencias alélicas similares

Equilibrio HW

Herencia mendeliana

Aproximación directa: variante individual ↔ enfermedad

secuenciación de partes funcionales de genes candidatos

Aproximación indirecta: marcador = conjunto de variaciones en la secuencia

no requiere información sobre la funcional

mayor eficiencia (90% de la variación)

● 5 técnicas de genotipación diferente: precisión, tasa éxito, coste● SNPs obtenidos en cada centro, regenotipados en otros● “random shotgun sequencing”: obtención de muchos SNPs● Estratregia jerárquica: DL y haplotipos varían en el genoma

TÉCNICAS GENOTIPACIÓN

Genotype SNPs

CEU JPT+CHB YRI ENr112 2p16.3 2,6 2,57 2,61

ENr131 2q37.1 2,21 2,11 2,13

ENr113 4q26 2,54 2,4 2,41ENm010 7p15.2 1,83 1,79 1,74

ENm013(500Kb) 7q21.13 1,77 1,68 1,68ENm014(500Kb) 7q31.33 3,34 3,24 3,23

ENr321 8q24.11 2,13 2,1 2,09

ENr232 9q34.11 1,91 1,83 1,81ENr123 12q12 2,19 2,18 2,04

ENr213 18q12.1 1,99 1,97 1,97

Total 22,51 21,86 21,7

Regionname

Chromosomeband

Genomic interval (NCBI B36 )

Chr2:51512208..52012208

Chr2:234156563..234656627

Chr4:118466103..118966103

Chr7:26924045..27424045

Chr7:89621624..90121624

chr7:126368183..126865324

Chr8:118882220..119382220

Chr9:130725122..131225122

Chr12:38626477..39126476

Chr18:23719231..24219231

ENCODE REGIONS

Proyecto para identificar todos los elementos funcionales del genoma humano

10 regiones de 500 kb

Inicio 2003, final de la 1ª fase en 2007

ENCODE regions: 1% genoma, 30 Mb

50% seleccionada al azar

50% seleccionada manualmente: genes o elementos bien conocidos

Selección de SNPs:

secuenciación ENCODE regions y SNPs adicionales

MAF ≥ 0,05 (variantes comunes)

Selección de SNPs, análisis de DL y haplotipos

ENCODE regions 48 muestras no relacionadas

10 regiones 16 CEU

500 kb 16 YRI

8 JPT

8 CHB

17,944 SNPs en 5 Mb

INCREMENTO DEL Nº DE SNPs

Nº de single-hit SNPs Nº de double-hit SNPs Base de datos

2001 2,6 millones DbSNP

2003 5,7 millones 2 millones DbSNP

2004* 6,8 millones 2,7 millones DbSNP

2005 9,2 millones (1 SNP/ 5kb)* DCC y dbSNP

Nº de SNPs

ENCODE regions 18000

Fase I 1 millón

Fase II* 4,6 millones más

SNPs

Espaciados regularmente

CS mitocondrial: no recombinación

CS Y: región no recombinante

CS X: ↑ SNPs raros o monomórficos, ↓ comunes

Precisión caracterización haplotipos: 99,7%.

Errores: 1cada 8 Mb en CEU, 1 cada 3,6 Mb en YRI

SNPs polimórficos 1,07 millones

YRI 85%

CEU 79%

CHB+JPT 75%

CORRELACIÓN ENTRE SNPs

Estudios de asociación

Existe correlación entre dto. SNP y SNPs vecinos

Proxy: SNP fuertemente correlacionado con uno o más SNPs

Examinar uno es equivalente a examinar el otro.

1/5 SNPs Proxy > 20

3/5 SNPs Proxy > 5

1/5 SNPs Ninguno

SNPs correlacionadosYRI 50%CEU, CHB+JPT 75%90% correlación significativa

DESEQUILIBRIO DE LIGAMIENTO

● Estructuras en bloque, hotspots

● Escala 1-100 kb, discontínuas● Determinadas por la tasa de recombinación● Se han detectado 21,617 hotspots (1 cada 122kb)● No todos los haplotipos interrumpidos por un hotspots

● CS X: haplotipos extensos● Centrómero: no recombinación (100 SNPs / haplotipo)

Extensión estructuras DL (entre CS)Distancia física ≠Distancia genética ≈ (CS X)

CS X: menor nº SNPs, menor tamaño población, recombinación restringida

RECOMBINACIÓN Y DL

● ↑ nº SNPs ↔ ↑ detección hotspots, precisión tasa recombinación

● Variación tasa recombinación => DL● Exámen DL genoma : tasa rec., composición sec., caratc. génicas.

● ↓ telómeros● ↑ centrómeros● Correlación longitud CS (excepción CS X)● Zonas + DL => + densidad génica

● Genes ir y neurofisiológicos: bajo DL (↑ diversidad génica, ambiente)● DNA/RNA, daño, ciclo celular: alto DL.

RECOMBINACIÓN

Human genome 500 kb 0.5 cM

ENCODE regions 500 kb 0,19-1,25 cM

88 hotspots (uno cada 57 kb)

5 Mb: 80% recombinación, 15% secuencia

HapMap project 21,617 hotspots (uno cada 122 kb)

TAG SNPS

Son el conjunto de SNPs de un haplotipo genotipados para una enfermedad.

Se seleccionan los SNPs con un alto grado de correlacion

SNPs ENCODE reduccion 75-90%, sin perdida de informaci'on

1 SNP cada 500bp 1 SNP cada 2 kb en YRI1 SNP cada 5 kb en CEU, CHB+JPT

Bajo numero de tag SNPs capta gran parte de la informacion

MEJORA DE LA EFICACIA DEL ANALISIS

Bajar el umbral de correlacion > menor cantidad de tag SNPs

Elegir tags basados en el numero de SNPs que captan

No claro si tag SNPs en una poblacion son utiles para otra

Algunos autores dudan o estan en contra de este proyecto por

este punto.

HAPLOVIEW

Información sobre:

Bloques de desequilibrio de ligamiento

marcadores

tests de asociación

SNPs: posición, homocigoto, heterocigoto, si está desviado o no del equlibrio

HW, la frecuencia alélica, etc

Haplotipos: tag SNPs

UNA VISIÓN GLOBAL DELHAPMAP PROJECT UNA VISIÓN GLOBAL DEL HAPMAP PROJECT.

Documents

Transcript of UNA VISIÓN GLOBAL DELHAPMAP PROJECT UNA VISIÓN GLOBAL DEL HAPMAP PROJECT.