UNA VISIÓN GLOBAL DELHAPMAP PROJECT UNA VISIÓN GLOBAL DEL HAPMAP PROJECT.
-
Upload
sens-vinal -
Category
Documents
-
view
20 -
download
3
Transcript of UNA VISIÓN GLOBAL DELHAPMAP PROJECT UNA VISIÓN GLOBAL DEL HAPMAP PROJECT.
UNA VISIÓN GLOBAL DELUNA VISIÓN GLOBAL DEL HAPMAP PROJECTHAPMAP PROJECT
Variación genoma humano(1 variación / 1000 bp)
Variación población humana mundial(1 variación / 300 bp)
SNPs 90% variación en la población10% otras variaciones poco comunes en la población
0,1% sitios nucleotídicos
10 millones sitios nucleotídicos
2 alelos → frecuencia ≥ 1%
Human Genome Project Similitudes
HapMap Project Diferencias
99,9% del genoma
0,1% del genoma
VARIACIÓN EN LA SECUENCIA HUMANA DE DNA
VARIACIÓN EN LA SECUENCIA HUMANA DE DNA
Tasa de mutación = 10-8 /sitio/generación
Nº generaciones ancestro común-humano actual: 104-105
CONSORCIO INTERNACIONAL HAPMAP● Primer encuentro: Julio 2001
– Desarrollo del plan científico
– Elección de las poblaciones
– Discusión de las cuestiones éticas
– Inicio formal del proyecto: Octubre 2002
● Determinación grupos participantes
● Asignación de trabajo a cada grupo
● Fuentes de ayuda económica
Identificar patrones de variación genética y crear una base de datos pública y gratuita.
Descubrir factores genéticos de susceptibilidad a determinadas enfermedades. No establece conexiones entre variantes particulares y enfermedades. Aspectos básicos sobre hotspots de recombinación, bloques de DL y haplotipos. Nuevos aspectos sobre la variación estructural y la recombinación e identifica loci que
han estado sujetos a la selección natural durante la evolución humana.
FASE I
HAPMAP PROJECTFASE II
2,1 millones de nuevos SNPs Mejora la selección de tag SNPs Nuevos aspectos sobre las estructuras DL Mejora la resolución del mapa genético y la localización de los hotspots
Country Role Chromosomes
Japan 2 25,1% 5, 11, 14, 15, 16, 17, 19
UK 3 Genotipación y análisis 24,0% 1, 6, 10, 13, 20
Canadá 1 Genotipación 10,0% 2, 4p
China 5 10,0% 3, 8p, 21
US 6 30,9% 8p, 9, 18q, 22, X, 4q, 7q, 18p, Y, 12, 7p
Nigeria 2 Centro de cordinación de datos ----- -------------
Nº research groups
Per cent genome
Genotipación, análisis, muestras, consultas públicas
Genotipación, muestras, compromiso comunitario
Genotipación, muestras, compromiso comunitario
GRUPOS PARTICIPANTES
Japan (JPT) 44 muestras Individuos no relacionados
China (CHB) 45 muestras Individuos no relacionados
Total 89 muestras Individuos no relacionados
US (CEU) 90 muestras 30 trios (2 padres + 1 hijo adulto)
Nigeria (YRI) 90 muestras 30 trios (2 padres + 1 hijo adulto)
Total 180 muestras 60 trios
MUESTRAS DE DNA Y POBLACIONES
CHB + JPT: frecuencias alélicas similares
Equilibrio HW
Herencia mendeliana
Aproximación directa: variante individual ↔ enfermedad
secuenciación de partes funcionales de genes candidatos
Aproximación indirecta: marcador = conjunto de variaciones en la secuencia
no requiere información sobre la funcional
mayor eficiencia (90% de la variación)
● 5 técnicas de genotipación diferente: precisión, tasa éxito, coste● SNPs obtenidos en cada centro, regenotipados en otros● “random shotgun sequencing”: obtención de muchos SNPs● Estratregia jerárquica: DL y haplotipos varían en el genoma
TÉCNICAS GENOTIPACIÓN
Genotype SNPs
CEU JPT+CHB YRI ENr112 2p16.3 2,6 2,57 2,61
ENr131 2q37.1 2,21 2,11 2,13
ENr113 4q26 2,54 2,4 2,41ENm010 7p15.2 1,83 1,79 1,74
ENm013(500Kb) 7q21.13 1,77 1,68 1,68ENm014(500Kb) 7q31.33 3,34 3,24 3,23
ENr321 8q24.11 2,13 2,1 2,09
ENr232 9q34.11 1,91 1,83 1,81ENr123 12q12 2,19 2,18 2,04
ENr213 18q12.1 1,99 1,97 1,97
Total 22,51 21,86 21,7
Regionname
Chromosomeband
Genomic interval (NCBI B36 )
Chr2:51512208..52012208
Chr2:234156563..234656627
Chr4:118466103..118966103
Chr7:26924045..27424045
Chr7:89621624..90121624
chr7:126368183..126865324
Chr8:118882220..119382220
Chr9:130725122..131225122
Chr12:38626477..39126476
Chr18:23719231..24219231
ENCODE REGIONS
Proyecto para identificar todos los elementos funcionales del genoma humano
10 regiones de 500 kb
Inicio 2003, final de la 1ª fase en 2007
ENCODE regions: 1% genoma, 30 Mb
50% seleccionada al azar
50% seleccionada manualmente: genes o elementos bien conocidos
Selección de SNPs:
secuenciación ENCODE regions y SNPs adicionales
MAF ≥ 0,05 (variantes comunes)
Selección de SNPs, análisis de DL y haplotipos
ENCODE regions 48 muestras no relacionadas
10 regiones 16 CEU
500 kb 16 YRI
8 JPT
8 CHB
17,944 SNPs en 5 Mb
INCREMENTO DEL Nº DE SNPs
Nº de single-hit SNPs Nº de double-hit SNPs Base de datos
2001 2,6 millones DbSNP
2003 5,7 millones 2 millones DbSNP
2004* 6,8 millones 2,7 millones DbSNP
2005 9,2 millones (1 SNP/ 5kb)* DCC y dbSNP
Nº de SNPs
ENCODE regions 18000
Fase I 1 millón
Fase II* 4,6 millones más
SNPs
Espaciados regularmente
CS mitocondrial: no recombinación
CS Y: región no recombinante
CS X: ↑ SNPs raros o monomórficos, ↓ comunes
Precisión caracterización haplotipos: 99,7%.
Errores: 1cada 8 Mb en CEU, 1 cada 3,6 Mb en YRI
SNPs polimórficos 1,07 millones
YRI 85%
CEU 79%
CHB+JPT 75%
CORRELACIÓN ENTRE SNPs
Estudios de asociación
Existe correlación entre dto. SNP y SNPs vecinos
Proxy: SNP fuertemente correlacionado con uno o más SNPs
Examinar uno es equivalente a examinar el otro.
1/5 SNPs Proxy > 20
3/5 SNPs Proxy > 5
1/5 SNPs Ninguno
SNPs correlacionadosYRI 50%CEU, CHB+JPT 75%90% correlación significativa
DESEQUILIBRIO DE LIGAMIENTO
● Estructuras en bloque, hotspots
● Escala 1-100 kb, discontínuas● Determinadas por la tasa de recombinación● Se han detectado 21,617 hotspots (1 cada 122kb)● No todos los haplotipos interrumpidos por un hotspots
● CS X: haplotipos extensos● Centrómero: no recombinación (100 SNPs / haplotipo)
Extensión estructuras DL (entre CS)Distancia física ≠Distancia genética ≈ (CS X)
CS X: menor nº SNPs, menor tamaño población, recombinación restringida
RECOMBINACIÓN Y DL
● ↑ nº SNPs ↔ ↑ detección hotspots, precisión tasa recombinación
● Variación tasa recombinación => DL● Exámen DL genoma : tasa rec., composición sec., caratc. génicas.
● ↓ telómeros● ↑ centrómeros● Correlación longitud CS (excepción CS X)● Zonas + DL => + densidad génica
● Genes ir y neurofisiológicos: bajo DL (↑ diversidad génica, ambiente)● DNA/RNA, daño, ciclo celular: alto DL.
RECOMBINACIÓN
Human genome 500 kb 0.5 cM
ENCODE regions 500 kb 0,19-1,25 cM
88 hotspots (uno cada 57 kb)
5 Mb: 80% recombinación, 15% secuencia
HapMap project 21,617 hotspots (uno cada 122 kb)
TAG SNPS
Son el conjunto de SNPs de un haplotipo genotipados para una enfermedad.
Se seleccionan los SNPs con un alto grado de correlacion
SNPs ENCODE reduccion 75-90%, sin perdida de informaci'on
1 SNP cada 500bp 1 SNP cada 2 kb en YRI1 SNP cada 5 kb en CEU, CHB+JPT
Bajo numero de tag SNPs capta gran parte de la informacion
MEJORA DE LA EFICACIA DEL ANALISIS
Bajar el umbral de correlacion > menor cantidad de tag SNPs
Elegir tags basados en el numero de SNPs que captan
No claro si tag SNPs en una poblacion son utiles para otra
Algunos autores dudan o estan en contra de este proyecto por
este punto.
HAPLOVIEW
Información sobre:
Bloques de desequilibrio de ligamiento
marcadores
tests de asociación
SNPs: posición, homocigoto, heterocigoto, si está desviado o no del equlibrio
HW, la frecuencia alélica, etc
Haplotipos: tag SNPs