Post on 25-Feb-2018
Memahami Urutan
Kuliah Umum22 Janu22 Janu
Habib RLaboratorium Genom
Genom
m BB Biogenari 2013ari 2013
Rijzaanimika & Bioinformatika
Manual Kehidupan
"Life DOES come read
VisiGen on DN
n
with instructions, them."
NA Sequencing
Gen vs Genom
Gen vs Genom
Gen vs. Genom
Gen:Genetika (genetics)1 atau beberapa genzoom-in
Genom:Genomika (genomics)Banyak atau seluruh gezoom-out
en
-om & -omika
Genom (gen+kromoso1920), genomika (1980-om: obyek kajian, -omArti: total atau keselurugenom+bioinformatika
Genomika, metagenomepigenomika, proteomiknutrigenomika, farmakotoksikogenomika, glikom
http://omics.org
m, Prof. Hans Winkler, 0-an), -omika (1990-an)ika: bidang kajianuhan(2000-an):
mika, transkriptomika, ka, metabolomika, ogenomika, mika, ekspresomika ...g
-omika
“Omika adalah istilah ubidang ilmu sains dan tinteraksi obyek informa'om' [ ] Fokus utamanom . [...] Fokus utamanobyek informasi sepert2) menemukan jalinan merekayasa jaringan dmemahami dan memanpengaturan; dan 4) medan sub-bidang -omika
omics.org
mum untuk sebuah teknik yang mempelajari asi hayati dalam berbagai nya adalah: 1) pemetaannya adalah: 1) pemetaan i gen, protein dan ligan; interaksi antar obyek; 3) an obyek untuk nipulasi mekanisme nggabungkan aneka -om
a.”
Pengurutan Genom
Sanger, 1975Berbasis kloning, PCR(gel/kapiler)500-1000 pb
m Gen. 1
R dan elektroforesis
Metode Sanger
Sanger utk. Genom
Shotgun sequencingGenom bakteri Haemophilus influenzae
1,830,137 pb25.000 potongan (50K reads)Program bionformatika utk. merakit urutan genom utuh
m
Shotgun Sequenci
Gen
Bacaa
Berjenjang
Bacaa
Pera
Ran
Urutan
ing
nom
an acak
Seluruh Genom
an acak
akitan
ngka
Genom
Pengurutan Genom
2005 (30 tahun setelah
m: Gen. 2
h Sanger)
Pengurutan Genom
Next-generation sequeTanpa kloning!
Pemain (kimia)( )454/Roche (pyrosequenSolexa/Illumina (reversiSolid/ABI (sequencing-b
m: Gen. 2
ncing (NGS)
ncing)ible terminator)by-ligation)
HiSeq2000
Illumina/Solexa seq
PP
P
P
quencing
Pemotongan genomPenambahan adapter
Pustaka DNA genom Pembentukan gugus
Perbanyakan potongan genom pada flow celllewat PCRSolid-state cloning
Pembacaan urutan
Penyiapan Pustaka
Pemotongan GenomNebulizer (gas)Sonicator (suara)g-Tube (gaya sentrifugag Tube (gaya sentrifugaTransposon (enzim)
a Genom
al)al)
Penyortiran ukuran
Proses pembentukan gDNA oleh mesin sekuepanjang potongan DNA
n potongan
gugus dan pembacaan enser hanya efektif pada A tertentu (100 – 500 pb)
Penempelan adaptter
Adapter untuk manipulasi dalam proses lanjutan
Barcode, indeksPemilihan ukuran & kuantifikasi
Bioanalyzer, qPCR
cBOT
Robot pembuat clusterr (gugus)
Pembentukan Gug
Penempelan potongan DNA dari pustaka genom ke flow cell & perbanyakan molekul DNA membentuk gugus 1000-an molekul melalui PCR
us
Pembacaan urutan
Illumina: pengurutan m(sequencing-by-synthe
n DNA
elalui sintesis sis, SBS)
Pembacaan urutan
Siklus 1
Siklus 2
Siklus 3
Siklus 4
Siklus 5, ...
1 2
n DNA
Bacaan 1: GCTGABacaan 2: AGCCG1 lajur flow cell => 100-200 juta gugus/bacaan200 juta gugus/bacaan
Pembacaan urutan
Single-end & Paired-eBacaan ujung tunggal
n DNA
nd reads& ujung berpasangan
Pengurutan Genom
Tanpa perbanyakan poLangsung dari 1 molekNanoteknologi, semikon
H liHelicosIon Torrent
Mendeteksi pelepasan dNTP oleh polimerase
Pacific BiosciencesSingle molecule real tim
m: Gen. 3
otongan DNA!kul DNAnduktor, sensor plasma
proton saat penyisipan
me (SMRT) sequencing
Helicos
Ion Torrent
Pac Bio
Perbandingan
Sanger 8
Roche / 454 4
AB / SOLiD 2x
Illumina / Solexa 2x
800 nt ~80 kb
450 nt 0.5 Gb
50 nt 60 Gb
100 nt 300 Gb
bases 1 Gb
10 Gb
ABsho
(
100 Gb
Perbandingan
rea
per machine run
10 bp 10
1 Gb
100 Mb
10 Mb
1 Mb
B/SOLiDv3, Illumina/GAIIort-read sequencers
454 GS FLX
10+Gb in 50-100 bp reads,>100M reads, 4-8 days)
From John McPherson, OICR
ad length1,000 bp00 bp
ABI capillary sequencer
454 GS FLX pyrosequencer
(100-500 Mb in 100-400 bp reads,0.5-1M reads, 5-10 hours)
(0.04-0.08 Mb in 450-800 bp reads,96 reads, 1-3 hours)
Perakitan urutan gSelayang pandang proses pembacaan selur
Reads
Potongan DNA genom
Contigs
Scaffolds
Pemetaanscaffolds
Peta genom
enomruh genom dengan teknik shotgun.
Gambaran menyeluruh dari semua reads yang saling bersambung dan
membentuk sebuah contig.
Perakitan urutan g
Tampilan dekat: urutan basa dari tiap read
(bacaan) dan posisinya dalam contig(sambungan).
Tampilan dekat: urutan basa dari contig yang
terbentuk.
enom
Istilah
Read (bacaan)Contig (sambungan)Scaffold (rangka)Scaffold (rangka)Gap (celah)
Celah fisik dan celah urCoverage (liputan)Depth (kedalaman)Quality score (skor kua
rutan
alitas basa)
Coverage depth (d
Coverage is the term uto which a large asseminstances of smaller obin which coverage is mread coverage of a genread coverage of a gencontigUkuran genom 1 MbSekuensing: 1 juta bacLiputan: panjang total b
(1 juta X 100 pb) / 1 juta
alamnya liputan)
sed to quantify the extent mbly object is covered by bjects. The three contexts ost often discussed are
nome read coverage of anome, read coverage of a
aan, 100 pbbacaan/ukuran genoma pb = 100X
Panjang potongan genom:
n
L
Panjang potongan genom:jumlah bacaan: npanjang tiap bacaan: l
Definisi: Coverage C = n
Berapa liputan yang cukup?
Model Lander-WatermanDengan asumsi sebaran C=10 akan menghasilkannukelotida.
L
C
L
L
n l / L
n:bacaan yang seragam,
n 1 celah per 1 juta
Q30
Skor kualitas basaSkala phred
QV = - 10 * log10(Pe)
P
g ( )Pe= kemungkinan salah.
Q30: kemungkinan salah 1/1000
99.9% benar
Phred Quality Perror(obs. base)
3 50.12%5 31.62%10 10.00%15 3.16%20 1.00%25 0.32%30 0.10%35 0.03%40 0.01%
Hasil pembacaan
@HWI_0023:1:1:16103
TTATGTGTTTATTACGTTNTTTACGGGTTATTTA
++
hhhhhhghhhhhhghdeeBhhghfffaehghhcX
Berkas format FastqSetiap basa memiliki ko
3:1200 N:0:1
NTTTG......AATGTTTA
Bee__......hfhhghhg
ode skor kualitas
Distribusi skor kuaalitas basa
Harga Genom
Penerapan
Pengurutan DNA, analianalisa ekspresi RNA, variasi DNA struktural, protein-DNA (Chip-Seqanalisa small RNA deanalisa small RNA, de metatranskriptomika, seMesin sama, pendekata
Penyiapan sampel/pustAnalisa data/bioinforma
isa pengaturan gen, penemuan SNP dan GWAS, analisa interaksi
q), analisa DNA metilasi, novo metagenomikanovo metagenomika, ekuensing amplikon,...aan berbeda dalam:taka genomatika
Genomika Fungsio
Sekuen genom +Koleksi mutan
Penyisipan T-Dt ki imutagen kimia
Profil ekspresi gen menMicroarray, ES
Sekuen genom lainPlasma nutfah
AnotasiPrediksi struktuontology), seku
onal
DNA, penandaan transposon, iawi
nyeluruhST, pustaka cDNA, transkriptom
terkait, spesies lain
ur dan fungsi gen (gene uen pengatur
Anotasi
>contig-1GAAAGATCGCTGGTTA
CTCTAATCACTTTTTTTCGCGGTTTCTGCGGATCCGAGTTAAACGCAAGAACCACAGAAAACGTCGTTTCTCGTTCT
APA
CAACCGAATATACAGCTTCTGCTCTGTAATCGTGCCATAAAATAAAGTAACTGATAGTCGCGCCTGAAACAGAAAATATCTCCTCGTTTCCG
A INI?
Anotasi
>gi|359806297Glycine maDATE 3A-like (LOC100
ATGGACCCTCTTGTCATAGATGTTTTGGAGCCTCTCTTA
FEATURES Location/Qsource 1..522
/organism="Glycin/chromosome="18
gene 9..122/note="protein HE
ax protein HEADING 815541)TTGGACGTGTAGTAGG
CTTTCACTAGTTGCGTC
Qualifiers
ne max"8"
ADING DATE 3A-like"
Anotasi
Memahami urutan genoUrutan genom (sambun
Tingkat DNA:gDimana exon, translasi, prom
Tingkat protein:Motif, domain,
Tingkat proses:Seluler, lokasi biokimia
omngan/rangka)
intron, situs awal transkripsi, moter, homologi
situs aktif, enzim
dalam sel, fungsi dalam sel, alur
Penerapan
De novo SequencingPerakitan genom tanpaDraft vs. FinishedContig (sambungan) daContig (sambungan) dapanjangChromosome
Targeted ResequencinFokus pada daerah tertMultiplex (sekali perunu
rujukan
an scaffold (rangka) yangan scaffold (rangka) yang
gtentu: exon, motif, familyutan, banyak sampel)
Penerapan
EpigenetikaMetilasi DNA (ChipSeq)Modifikasi histonKemudahan akses krom
MetagenomikaDe novo sequencing saKeragaman 16S DNAmetatranskriptom
)
matin
ampel lingkungan
Contoh
A complete reference gindeed a valuable resoimprovement is finding variation.
Urutan genom rujukan ipemuliaan tanaman adamemanfaatkan variasi g
genome sequence is urce, but the key to crop and exploiting genetic
itu berharga, tetapi kunci alah menemukan dan genetis
Contoh
A map of rice genome vaof cultivated rice
Nature. 20
S iSequencing:1529 genom padi:
446 Oryza rufip1083 Oryza sa
15 genom pembanding coverage)1 O. Rufipogon (100X coutgroug (50X coverage
ariation reveals the origin
012 Oct 25;490(7421):497-501.
pogon (paired-end, 2X coverage)ativa (paired-end, 1X coverage)
(outgroup, wild oryza 3X
coverage, de novo), 1 e)
Metode
Pemetaan thd. genom Identifikasi SNPGenetika populasi
GWASPopulasi pemetaan, BILAsosiasi fenotipe
AnotasiBLAST, prediksi model
rujukan
L & CSSL
gen, lokasi SNP
Contoh
Resequencing 50 accewild rice yields markersagronomically importan
Xun Xu, Susan McCoucnature biotechnology VJANUARY 2012Cultivar: 40
Japonica: 24Indica: 12
Wild type: 10Rufipogon: 5Nivara: 5
essions of cultivated and s for identifying nt genesch et alVOLUME 30 NUMBER 1
Hasil
Jutaan SNP teridentifikMenguak proses dome
Japonica dan indica secdidomestikasiJaponica bernenek moyChina
Penemuan genRibuan gen terseleksi smungkin penting secara
Penemuan markaSNP untuk pemuliaan p
kasiestikasi padi:cara independen
yang O. Rufipogon dari
selama proses domestikasi, a agronomis
padi
Terima kasih