Haploview: análise e visualização de mapas e LD...
Transcript of Haploview: análise e visualização de mapas e LD...
Haploview: análise e visualização de mapas e LD haplótipos
Informação sobre o artigo:
Autores: JC Barret, B. Fry, J. Maller e MJ Daly
Respectivas filiações:
Whitehead Institute for Biomedical Research Cambridge, MA 02142, EUA
MIT Media Lab Cambridge, MA 02139, EUA Instituto Broad do MIT e de Harvard em Cambridge, MA, EUA
Data : 23 de julho de 2004.
Realizado por:
Carlos Rodrigues 070316102
Liliana Mota 070307056
Haploview: análise e visualização de mapas e LD haplótipos 2012
2
“A tecnologia digital é a arte de criar necessidades desnecessárias mas que se tornam absolutamente
imprescindíveis.”
Joelmir Beting
Haploview: análise e visualização de mapas e LD haplótipos 2012
3
Índice
Terminologias .......................................................................................4
Introdução............................................................................................5
Características do Haploview .................................................................6
Versões de Haploview ...........................................................................9
Conclusões .........................................................................................13
Referências ........................................................................................14
Haploview: análise e visualização de mapas e LD haplótipos 2012
4
Terminologias Alelo: Representa uma das formas alternativas para um determinado gene, no qual
ocupa um locus (posição) num cromossoma. A combinação entre alelos determina as características de um determinado individuo. Cromossoma: Sequência de DNA que contém vários genes e outras sequências de
nucleotídeos com funções especificas nas células dos seres vivos.
Locus(plural: loci): Local fixo num determinado cromossoma aonde se localiza
determinado gene ou marcador genético.
Marcador genético: Característica que identifica diferenças entre dois ou mais
organismos. Usados para o estudo da diversidade populacional.
Desequilíbrio de ligações(LD): Associações alélicas não aleatórias que ocorrem com
mais ou menos frequência que seria esperado numa determinada população. LD é
influenciado com seguintes factores; ligação genética, selecção, taxa de combinação,
taxa de mutação, deriva genética, combinação não aleatória de acasalamento e
estrutura da população.
Dados pedigree: Fornece dados probabilísticos sobre dados quantitativos no campo
biológico ou estudos laboratoriais.
Equilibrio de Hardy-Weinberg: É o estudo dos genes (variantes) do ponto de vista de
sua distribuição na população. Esta lei afirma que de geração em geração as
frequências alélicas vão se tornando constantes.
transmission disequilibrium test (TDT): Testa a ligação entre um marcador e um locus
de susceptibilidade doença e características quantitativas.
Teste X2: Usado para comparar as frequências observadas com Frequências esperadas.
Haploview: análise e visualização de mapas e LD haplótipos 2012
5
Introdução A variação genética é elevada nas populações humanas, provém da diversidade
das combinações alélicas nas recombinações transmitidas de geração em geração. Mas
pode ocorrer erros nessas recombinações causando danos para o individuo.
Um haplótipo é uma combinação de alelos, que se encontram em locais
adjacentes (loci) no cromossoma e são transmitidos juntos na transmissão genética.
No entanto pode ocorrer um desequilíbrio de ligação local (LD) num bloco causando
assim determinadas doenças, tais como os diabetes, cancro, doenças cardíacas,
depressão e asma são afectadas por muitos genes e factores ambientais.
O estudo destas estruturas e determinação de padrões haplótipos no genoma
humano tem sido muito importante para a genômica médica, medicina evolutiva ,
moderna e aplicações farmacêuticas. Com o decorrer do tempo e o aumento da
informação levaram ao desenvolvimento de um projecto denominado HapMap que
tem como objectivo desenvolver um mapa de haplótipos do genoma humano (base
dados), no qual descreve os padrões comuns de variação humana na sequência de
DNA. O estudo destas variantes fornece informação sobre as causas que levam ao
desenvolvimento das doenças no Ser Humano.
Dado ao grande número de informação contida no HapMap foi necessário o
desenvolvimento de uma ferramenta para análise, interpretação e visualização de
haplótipos, facilitando assim a pesquisa de vários investigadores. Foi desenvolvido
assim um software que fornece dados estatísticos denominado Haploview.
Tendo como objectivo fornecer uma análise rigorosa sobre haplótipos, além de
gerar estatísticas de marcadores, ainda fornece informação sobre ligações LD, blocos
haplótipos e frequências destes na população. Todos os recursos podem ser alterados
conforme o interesse do utilizador e todos os cálculos são realizados em tempo real,
mesmo para conjuntos de dados com centenas de pessoas e centenas de marcadores.
Haploview: análise e visualização de mapas e LD haplótipos 2012
6
Características de Haploview Haploview permite carregar informação em vários formatos, sendo compatível
com quaisquer formatos de dados provenientes do projecto HapMap, no qual permite
uma ligação directa de leitura da base de dados. Dados pedigree carregados permite
ler informação de cromossomas em diferentes estados, especificar informação
estrutural de cada família e ainda permite comparação de doenças com casos controle.
A informação dos marcadores pode ser carregada com o nome ou localização, mas
estes são carregadas separadamente.
Contem um navegador gráfico para visualização do genoma em que possibilita
aos utilizadores uma navegação localizada numa região específica escolhidas por eles,
mostrando todos os marcadores presentes nessa região. Os marcadores dessa região
tem que estar de acordo com o equilíbrio de Hardy-Weinberg, registo de erros da
herança mendeliana e percentagem de indivíduos genotipados para esse marcador. Só
os marcadores de interesse é que são filtrados pelo próprio programa, mas o utilizador
pode ajustar os limites dependendo da sua pesquisa, adicionando ou eliminando
marcadores. Todas as alterações feitas alteram de uma forma imediata análise em
curso.
Haploview: análise e visualização de mapas e LD haplótipos 2012
7
Figura 1 – Exemplo do ecrã do software HaploView [1]
O Haploview calcula ainda várias medidas para pares de LD que usa para criar
uma representação gráfica como demonstrado na figura acima. Utilizador pode ainda
usar um esquema de cores para identificar as diferentes relações LD. A medida que
analise está a decorrer este mostra as variáveis e a taxa de recombinação
(esquerda/cima). A direita está informação sobre haplótipos da região seleccionada.
Estes haplótipos são gerados depois da selecção de marcadores escolhidos de forma
automática ou manual, ainda gera as suas frequências populacionais.
A figura mais a direita ainda mostra a representação em blocos, em que as
linhas representam a transição entre blocos e espessura indica o grau de LD. A
personalização está novamente presente, podendo exibir alelos como letras, números
ou caixas coloridas. Haploview pode ainda calcular estatísticas TDT e X2
(caso/controlo), para cada marcador. Haploview é organizado em vários tab,
permitindo ao utilizador analisar os dados em tempo real. As informações de cada
janela podem ainda ser convertida para um arquivo PNG, podendo ser utilizado em
apresentações, publicações ou ficheiros texto. O programa pode ainda ser manipulado
através de uma linha de comandos, que permite ao utilizador executar todas as
análises sem abrir a interface gráfica.
Haploview: análise e visualização de mapas e LD haplótipos 2012
8
As versões futuras incluirão vários haplótipos-tag métodos de selecção de SNP,
bem como haplótipos baseados em testes de associação e de avaliação de significância
usando o teste de permutação. Estas características finais vão permitir que o utilizador
a partir de dados do genótipo explore associações genéticas através de um software
de fácil utilização.
Este software é escrito numa linguagem java no qual permite assim que
qualquer plataforma que possua pelo menos java 1.3 pode correr esta aplicação. Neste
artigo é referente a versão 2.05 de Abril de 2004, o Haploview podia ser exibido um
conjunto de dados com 200 marcadores genotipados em 400 indivíduos e ajustar
parâmetros sem nenhum atraso perceptível. O programa também permite o uso da
linha de comandos para fazer cálculos LD em conjuntos de dados muito grandes, em
quantidades pequenas de tempo.
Haploview: análise e visualização de mapas e LD haplótipos 2012
9
Versões de Haploview Como se trata de um artigo de Abril de 2004, com o passado dos anos foram
sendo lançadas novas versões deste software, aqui vai-se listar todas as versões
lançadas e suas melhorias.
Versão 3.0 (Outubro de 2004) [2]
Bugfixes for block size display, checkdata tab, allele sorting, EM missing
data.
Added compressed PNG output mode.
Lots of new command line options.
Changed batch mode input format.
Re-sort out of order info files.
Substantial improvement in speed and memory usage in EM.
New color schemes.
Added additional sample information for 2nd and 3rd HapMap plate.
Fixed handling of complex pedigrees.
Added proportional spacing to LD display.
Added HapMap GBrowse track.
Filter individuals with lots of missing genotypes.
Haplotype association tests.
Update checker.
Versão 3.1 (Janeiro de 2005) [2]
Additional HapMap info track display options.
Improved parsing of complex pedigrees.
Fixed bug with loading of haps style input files.
Fixed bug with correctly parsing out-of-order info files.
Fixed problem with association tests on datasets with no blocks.
Fixed bug with exporting range of markers to LD PNG.
Haploview: análise e visualização de mapas e LD haplótipos 2012
10
Versão 3.2 (Abril de 2005) [2]
added Tagger interface
added custom association test input
added permutation testing of association results
improved memory efficiency for EM haplotype reconstruction
added Perlegen sample Ids
fixed bug in PNG export cutting off final marker
Versao 3.3 (Maio de 2006) [2]
support for X chromosome
major memory usage improvements allow multiple analysis tracks and label Y axis
added user defined hapmap sample option
added haplotypes only permutation option
added option to show different LD measures or hide them
added -memory switch and changed default to 512M
added minor allele to check panel
added progress bar for data loading
support for alphabetical (ACGT) input format
added individual information dialog
added check panel for phased haps files
added dump tags button
last popup dialog is shown at top of display
added GOLD style color scheme
can sort tables by clicking on headers
changed case control allele order
Versão 4.0 (Agosto de 2007) [2]
Haploview: análise e visualização de mapas e LD haplótipos 2012
11
dded support for HapMap PHASE format data
added support for phased HapMap downloads
added support for PLINK output files including plotting functionality
added a number of Tagger features to coincide with the Tagger website
functionality
added 2-marker aggressive tagging from the command line
added log file functionality to command line mode
added proxy support
added table sorting to Tagger configuration
added numerous minor display and interface tweaks
added export options for Mendel errors and male heterozygotes on x
chromosome
added command line HapMap info track download
added case control frequencies to command line association output
added ld values selection to command line image export
added citation information to the "About" dialog
added "Uncapture All" button to Tagger
added build 36 option to HapMap info track downloads
added http:// loading for files on the command line and initial load screen
changed some labelling in Tagger and made pairwise the default option
changed obsHet calculation to use founders only
changed HW and het calculations to show as "NA" in X data with too few
individuals
enhanced GUI design with tabbed pane for initial loading dialog
Versão 4.1 (Abril de 2008) [2]
Haploview: análise e visualização de mapas e LD haplótipos 2012
12
added support for GeneCruiser lookup
added support for HapMap release 22
added -out fileroot specification to the command line
added consecutive filtering to PLINK with view/add/remove filters
added SVG output for LD plot and haplotype blocks display
added min design scores to Tagger in GUI and command line
added reset thresholds button to Tagger
added exclude A/T and C/G SNPs button to Tagger
upgraded graphing packages to latest version
changed load screen dialog tab orientation for Mac OSX
fixed bug with LD display pop-up on certain systems
fixed bug with HapMap info track caching
fixed bug on LD Display with MAF of .5
fixed bug where setting tagger cutoff fields to blank would generate exceptions
fixed bug with PLINK View Filters dialog
fixed bug with PLINK file column number mismatches
Versão 4.2 (Em Setembro de 2009) [2]
added support for Phase 3 HapMap
added support for the latest version of GeneCruiser
added GeneCruiser lookup to Region Dialog in PLINK tab
added search as you type and prune table to PLINK results
added "-v/-version" to option to the command line
changed tab orientation for initial load screen on Mac OSX
disabled Genecruiser for non HG18 Hapmap Releases
Actualmente este software encontra-se em modo de “congelamento” estando
a espera que alguém através de mais investigação consiga trazer melhorias futuras de
forma a conseguir-se obter resultados cada vez mais eficientes.
Conclusão
Haploview: análise e visualização de mapas e LD haplótipos 2012
13
Haploview consistiu uma óptima ferramenta para a pesquisa dos investigadores
na área da genômica, no qual permite uma pesquisa fácil e rápida e ainda apresenta
uma série de informações e cálculos estatísticos. Permite ainda ao utilizador
personalizar o aspecto visual facilitando a leitura de dados. Sendo assim um software
open source, intuitivo e user-friendly.
Referências
Haploview: análise e visualização de mapas e LD haplótipos 2012
14
Fonte do artigo: http://bioinformatics.oxfordjournals.org/content/21/2/263.abstract
[1 ] - http://bioinformatics.oxfordjournals.org/content/21/2/263/F1.large.jpg
[2] - http://www.broadinstitute.org/science/programs/medical-and-population-
genetics/haploview/version-history
Diversas fontes:
http://pt.wikipedia.org/wiki/Alelo
http://es.wikipedia.org/wiki/Haplotipo
http://hapmap.ncbi.nlm.nih.gov/
http://www.broadinstitute.org/scientific-community/science/programs/medical-and-
population-genetics/haploview/haploview
http://www.broadinstitute.org/science/programs/medical-and-population-
genetics/program-medical-and-population-genetics