Aproksimasi Interval Konfidensi Bootstrap. Haeruddin.pdfAproksimasi Interval Konfidensi Bootstrap...

14
Jurnal EKSPONENSIAL Volume 2, Nomor 1, Mei 2011 ISSN 2085-7829 Program Studi Statistika FMIPA Universitas Mulawarman 1 Aproksimasi Interval Konfidensi Bootstrap Approximate Confidence Interval Bootstrap Haeruddin Program Studi Statistika FMIPA Universitas Mulawarman Abstract We consider the problem of constructing approximate confidence intervals for a single parameter based on bootstrap computation percentile of a statistics. The standard approximate based on maximum likelihood z ˆ ˆ can be quite misleading and inaccurate. In practice, tricks based on transformation are often used to improve their accuracy. The confidence intervals ] θ ˆ , θ ˆ [ α 1 α constructed by using this approach arc also based on existence monoton transformation and have transformation-respecting property that is not possessed by standard normal approximate. The advantage of this approach, at least in practicing, is that it is automatically in corporate the transformation without requiring the statistician to think them through for each new application. It is handled by bootstrap computation. It is shown that the percentile interval is exact whenever the transformation known and it is consistent also by mean of confidence set i.e ) 1 ( ] θ ˆ , θ ˆ [ θ P α 1 α convergen to 0. In practice we must use some finite number B reptication, so that in setting these intervals we use Monte Carlo simulation that produce ] θ ˆ , θ ˆ [ α 1 α as an approximate to the ideal bootstrap interval. All of the process are done by a computer program in S-PLUS. Keywords : Bootstrap, confidence interval, bootstrap percentile, Monte Carlo, transformation. PENDAHULUAN Dalam banyak masalah inferensi statistik seorang peneliti tertarik untuk mengkontruksi suatu keluarga himpunan yang memuat nilai parameter yang benar dengan probabilitas yang tinggi. Dalam hal ini yang dikerjakan adalah suatu penaksiran selang (estimasi interval), yakni bagaimana membentuk interval random x atau disingkat , yang mempunyai peluang tinggi memuat . Misalkan g L (x) dan g u (x) adalah statistik sedemikian hingga berlaku : 1 x g θ x g P U L Interval random [g L (x); g u (x)] dinamakan interval konfidensi 1 – 2α untuk parameter dengan koefisien konfidensi (1 – 2α). Dalam tulisan ini dipertimbangkan masalah membangun aproksimasi interval-interval konfidensi bootstrap untuk suatu parameter tunggal . Interval-interval konfidensi exact dapat dikonstruksi hanya dalam kasus parametrik dan dalam sedikit situasi-situasi khusus sehingga umumnya yang dibangun adalah aproksimasi dari interval tersebut. Fokus utama dalam teori asimtotik interval konfidensi adalah apakah cakupan probabilitas suatu interval konvergen ke level nominal interval tersebut. Dalam banyak kasus, himpunan kepercayaan dikonstruksi dengan mempertimbangkan suatu kuantitas pivotal F , X ,..., X n 1 n n berdistribusi G n . Jika kita dapat menurunkan θ θ θ dari pertidaksamaan 1 U L P n , maka , merupakan interval konfidensi dengan level 1 - 2α. Untuk kasus dimana parameter lokasi, maka n biasanya berbentuk n n σ ˆ θ θ ˆ , dimana n θ ˆ estimator dan 2 n σ ˆ estimator varians untuk n θ ˆ maka interval konfidensi exact 1 - 2α untuk adalah: ] ) ( G σ ˆ θ ˆ α), (1 G σ ˆ θ ˆ [ 1 n n n 1 n n n Untuk mencari kuantitas pivotal seperti di atas dalam suatu masalah yang diberikan biasanya tidak mudah, dengan kata lain tidak mudah mencari n dengan G n distribusi yang diketahui. Jika G n tidak diketahui maka interval (1,1) tidak dapat digunakan sebagai interval konfidensi dan untuk itu digunakan aproksimasi dari G n . Dalam pendekatan asimptotik tradisional G n diganti dengan limitnya. Jika limit G n adalah G (independen dari F) maka G n diganti dengan G.

Transcript of Aproksimasi Interval Konfidensi Bootstrap. Haeruddin.pdfAproksimasi Interval Konfidensi Bootstrap...

Page 1: Aproksimasi Interval Konfidensi Bootstrap. Haeruddin.pdfAproksimasi Interval Konfidensi Bootstrap Approximate Confidence Interval Bootstrap Haeruddin Program Studi Statistika FMIPA

Jurnal EKSPONENSIAL Volume 2, Nomor 1, Mei 2011 ISSN 2085-7829

Program Studi Statistika FMIPA Universitas Mulawarman 1

Aproksimasi Interval Konfidensi Bootstrap

Approximate Confidence Interval Bootstrap

HaeruddinProgram Studi Statistika FMIPA Universitas Mulawarman

AbstractWe consider the problem of constructing approximate confidence intervals for a single parameter

based on bootstrap computation percentile of a statistics. The standard approximate based on maximum

likelihood zˆˆ can be quite misleading and inaccurate. In practice, tricks based on transformation are

often used to improve their accuracy.

The confidence intervals ]θ,θ[ α1α

constructed by using this approach arc also based on

existence monoton transformation and have transformation-respecting property that is not possessed bystandard normal approximate.

The advantage of this approach, at least in practicing, is that it is automatically in corporate thetransformation without requiring the statistician to think them through for each new application. It ishandled by bootstrap computation.

It is shown that the percentile interval is exact whenever the transformation known and it is consistent

also by mean of confidence set i.e )1(]θ,θ[θP α1α

convergen to 0.

In practice we must use some finite number B reptication, so that in setting these intervals we use

Monte Carlo simulation that produce ]θ,θ[ α1α

as an approximate to the ideal bootstrap interval. All of

the process are done by a computer program in S-PLUS.

Keywords : Bootstrap, confidence interval, bootstrap percentile, Monte Carlo, transformation.

PENDAHULUANDalam banyak masalah inferensi statistik

seorang peneliti tertarik untuk mengkontruksisuatu keluarga himpunan yang memuat nilaiparameter yang benar dengan probabilitas yangtinggi. Dalam hal ini yang dikerjakan adalah suatupenaksiran selang (estimasi interval), yaknibagaimana membentuk interval random

x atau disingkat , yang

mempunyai peluang tinggi memuat . MisalkangL(x) dan gu(x) adalah statistik sedemikian hinggaberlaku :

2α1xgθxgP UL

Interval random [gL(x); gu(x)] dinamakan intervalkonfidensi 1 – 2α untuk parameter dengankoefisien konfidensi (1 – 2α).

Dalam tulisan ini dipertimbangkan masalahmembangun aproksimasi interval-intervalkonfidensi bootstrap untuk suatu parametertunggal .

Interval-interval konfidensi exact dapatdikonstruksi hanya dalam kasus parametrik dandalam sedikit situasi-situasi khusus sehinggaumumnya yang dibangun adalah aproksimasi dariinterval tersebut. Fokus utama dalam teoriasimtotik interval konfidensi adalah apakahcakupan probabilitas suatu interval konvergen kelevel nominal interval tersebut.

Dalam banyak kasus, himpunan kepercayaandikonstruksi dengan mempertimbangkan suatu

kuantitas pivotal F,X,...,X n1nn berdistribusi Gn. Jika kita dapat menurunkan

θθθ dari pertidaksamaan

2α1ULP n , maka ,

merupakan interval konfidensi dengan level 1 -2α. Untuk kasus dimana parameter lokasi, maka

n biasanya berbentukn

n

σ

θθ , dimana nθ

estimator dan2nσ estimator varians untuk nθ

maka interval konfidensi exact 1 - 2α untuk adalah:

])(Gσθα),(1Gσθ[ 1nnn

1nnn

Untuk mencari kuantitas pivotal seperti di atasdalam suatu masalah yang diberikan biasanyatidak mudah, dengan kata lain tidak mudah

mencari n dengan Gn distribusi yang diketahui.

Jika Gn tidak diketahui maka interval (1,1) tidakdapat digunakan sebagai interval konfidensi danuntuk itu digunakan aproksimasi dari Gn. Dalampendekatan asimptotik tradisional Gn digantidengan limitnya. Jika limit Gn adalah G(independen dari F) maka Gn diganti dengan G.

Page 2: Aproksimasi Interval Konfidensi Bootstrap. Haeruddin.pdfAproksimasi Interval Konfidensi Bootstrap Approximate Confidence Interval Bootstrap Haeruddin Program Studi Statistika FMIPA

Jurnal EKSPONENSIAL Volume 2, Nomor 1, Mei 2011 ISSN 2085-7829

Program Studi Statistika FMIPA Universitas Mulawarman 2

Aproksimasi yang paling banyak dipakaiadalah interval aproksimasi normal standardengan menggunakan Teorema Limit Pusatyakni:

αz σθ (1.2)

Suatu pendekatan interval konfidensiberdasarkan komputasi bootstrap ditulis olehEfron.

R.Helmers (1995) memberikan perbandinganantara interval konfidensi standar dengan intervalkonfidensi bootstrap untuk parameter

dF(x)xμθ dengan F tidak diketahui.

Beberapa teori asimptotik untuk bootstrapdibahas oleh Bickel dan Freedman (1981) tentangkeakuratan ditulis oleh Singh (1981).

Hall (1986) memberikan cacah simulasibootstrap yang dibutuhkan untuk membangunsuatu interval konfidensi khusus intervalkonfidensi persentil-t berdasarkan n sampeldistribusi kontinu. Sebagai pedoman Efron danTibshirani menyarankan untuk mengambil Bantara 50 sampai dengan 200 yang cukup

memberikan estimasi yang baik dari θseF

untuk interval konfidensi bootstrap dibutuhkan Byang lebih besar lagi.

Dalam tesis ini dibahas tentangpengkonstruksian interval konfidensi berdasarkanpersentil bootstrap yakni interval persentil BP danBC. Kedua interval ini dibangun didasarkankepada asumsi adanya transformasi monoton ,namun untuk interval BC asumsi yang dipakailebih umum dari interval BP yaitu adanya sukukoreksi bias z0.Dalam penelitian ini akan dilihat tingkat akurasikedua interval persentil tersebut danperbandingannya dengan interval aproksimasinormal standar. Sebagai penunjang diberikansimulasi perbandingan interval-interval persentildengan interval berdasarkan aproksimasi normalstandar dan dengan aproksimasi normalberdasarkan transformasi.

PENGERTIAN DASAR BOOTSTRAPPrinsip Dasar BootstrapDefinisi

Jika X = (X1, X2, …, Xn) sampel random dari

F maka *n

*2

*1

* X,...,X,XX adalah sampel

random bootstrap yaitu sampel yang diperolehdari X secara random dengan pengembalian

*n

*2

*1 X,...,X,X independen dan identik

berdistribusi bersyarat terhadap X.Prosedur bootstrap dapat diterapkan untuk

kasus non parametrik maupun parametrik. Dalamkedua kasus tersebut, inferensi didasarkan padasuatu sampel X dan n random iid observasi daripopulasi.

Dalam kasus non-parametrik, distribusisampel Fn diambil dari distribusi populasi F yangtidak diketahui, Fn disebut distribusi empirik dariX, yakni fungsi distribusi yang mempunyai massa1/n untuk setiap titik pada X, sedangkan untukkasus parametrik F diketahui. Dalam kedua kasustersebut sampel X* diambil dengan resamplingdari suatu distribusi yang ditentukan sampel asliX.

Prinsip dasar dalam pembentukan sampeldengan metode bootstrap non-parametrik adalahsebagai berikut:1. Konstruksi distribusi probabilitas dari

sampel, yaitu Fn dengan massa 1/n padasetiap titik x1, x2, …, xn.

2. Dengan Fn tetap, ambil sampel random

dengan ukuran n dari Fn sebut*iX dengan:

nind*i

*i

*i F~X,xX , i = 1, 2, 3, …, n.

Selanjutnya sampel ini disebut sampel

bootstrap, *n

*2

*1

* X,...,X,XX

3. Aproksimasi distribusi sampling nn FX,

dengan distribusi bootstrap *n

**n F,X

Dalam kasus parametrik, F diketahui kecualiparameter yang tidak diketahui. Jadi pada kasusparametrik F diganti dengan F(), suatu anggota

dari klas {F(), }. Misalkan λ estimatordari dihitung dari X ditulis (X). maka

λFFn fungsi distribusi yang diperoleh

dengan mengganti nilai parameter denan estimasisampelnya.

Misalkan X* sampai random dari λFFn

dan misalkan Xλλ*menyatakan versi λ

yang dihitung dari X*. Maka ** λFF .

Bagian yang sulit dari prosedur bootstrap iniadalah perhitungan yang sebenarnya daribootstrap. Tiga metode perhitungan yangmungkin, yaitu:1. Metode 1. Perhitungan secara langsung.2. Metode 2. Metode perluasan deret Taylor

dapat digunakan untuk memperolehperkiraan mean dan varians dari distribusibootstrap R*.

3. Metode 3. Dengan simulasi Monte Carlountuk distribusi bootstrap. Denganmerealisasikan X* yang dibangun denganmengambil sampel random berukuran n danFo sebut x*1, x*2, …, x*α, dan histogram yangbersesuaian dengan nilai

n*n

n*2

n*1 F,x...,,F,x,F,x

diambil sebagai perkiraan untuk distribusibootstrap yang sebenarnya.

Prosedur bootstrap untuk estimasi adalah sebagaiberikut:

Page 3: Aproksimasi Interval Konfidensi Bootstrap. Haeruddin.pdfAproksimasi Interval Konfidensi Bootstrap Approximate Confidence Interval Bootstrap Haeruddin Program Studi Statistika FMIPA

Jurnal EKSPONENSIAL Volume 2, Nomor 1, Mei 2011 ISSN 2085-7829

Program Studi Statistika FMIPA Universitas Mulawarman 3

1. Estimasi F dengan Fn dan hitung

nn Fθθ .

2. Diberikan X1, X2, …, Xn, misalkan*n

*2

*1 X,...,X,X adalah suatu sampel iid

dengan distribusi Fn.3. Misalkan

n*n

*2

*1nn

*n θX,...,X,Xθb adalah

versi bootstrap dari n .

4. Distribusi n di bawah F, yaitu F(n)

diestimasi dengan *nnF , distribusi dari

*n di bawah Fn.

Untuk menjelaskan metode bootstrap secaraumum dipandang n = n(X1, X2, …, Xn) yaitubesaran yang tergantung dari sampel X = (Xt, X2,…, Xn) dan fungsi distribusi F. Untuk kasus

khusus dapat diambil θθn nn ,

dimana θ adalah statistik untuk . Selanjutnya

akan dicari distribusi dari n sebagai berikut.

x

,xFX,...,X,XPxG n21nn

Jelas Gn yaitu fungsi distribusi dari n ini tidakdiketahui, karena F tidak diketahui. Dalam hal iniGn akan diestimasi dengan bootstrap yaitu :

XX,...,X,XPxG *n

*2

*1n

**n dimana:

*n

*2

*1

* X,...,X,XX adalah sampel bootstrap

dan P* adalah probabilitas yang bersesuaian

dengan nF . Karena X1 = x1, X2 = x2, …, Xn = xn

diketahui maka X* dan nF diketahui, sehingga

pada prinsipnya*nG dapat dihitung.

Syarat Bootstrap BekerjaDiperhatikan kasus khusus yaitu jika = (F)

= mean populasi dari F dan nn Xθ = sampel

mean maka θθn nn dan didapat:

xX,...,X,XPxG n21n*n

xXXnP n*n

*nX merupakan sampel bootstrap dari distribusi

θθn nn , dengan

*i

1*n XnX

Teorema 2.1.2 (Singh, Teorema A)Jika X1, …, Xn sampel iid dengan ukuran n

dari suatu populasi berdistribusi F dan EX2 < ∞, maka

0xXXnPxμXnP n*n

*n a.s.

Teorema 2.13Andaikan X1, …, Xn p-vektor random iid

dengan distribusi p2,F dan

μXn nn dimana i1ΣXnX dan

μXE 1 HBOOT versi bootstrap dari Hn maka

HBOOT konsisten.Dua teorema di atas menunjukkan bahwabootstrap dengan sampel iid bekerja dengan baik

untuk kasus nXθ .

Simulasi Monte CarloDiberikan sampel random X1, X2, …, Xn dari

distribusi F. Estimasi bootstrap memerlukan

sampel bootstrap*n

*2

*1 X,...,X,X dari distribusi

Fn. Untuk distribusi dari kuantitas statistik

n21 X,...,X,Xnn , estimator bootstrap

merupakan distribusi bersyarat

*n

*2

*1

* X,...,X,Xnn , jika diberikan

sampel (X1, X2, …, Xn). Pada prinsipnyadistribusi ini diketahui. Untuk sampel X1, X2, …,Xn dari n bilangan yang berbeda, ada (2n – 1)!/(n– 1)!n! sampel bootstrap yang berbeda, jadi

distribusi*n dapat diperoleh kembali dengan

enumerasi lengkap. Untuk n = 10 biasanyamendekati 100.000 sampel bootstrap yang dapatdienumerasi. Jadi metode ini sulit bahkan tidakmungkin untuk dikerjakan, untuk itu kita gunakansuatu metode yang sangat populer saat ini yaitumetode Monte Carlo.

Proses kerja simulasi Monte Carlo adalahsebagai berikut:1. Dengan bantuan komputer, bangun suatu

sampel iid *n

*2

*1 X,...,X,X dengan ukuran

n, menurut distribusi Fn.2. Karena Fn diketahui, juga Fn diketahui dan

dapat dihitung

FX,...,X,X *n

*2

*1

*nn

3. Ulangi bagian (1) dan (2) sebanyak B kali,

sehingga diperoleh*

,*

2,*

1, ,...,, Bnnn .

4. Kumpulkan nilai*

,*

2,*

1, ,...,, Bnnn dan

hitung distribusi empiris

B

i

*in,Bn, xI

B

1xF .

Misalkan distribusi bootstrap dai H adalah:

x θθnPxH n*n

1/2*BOOT

Maka pendekatan Monte Carlonya adalah:

B

in

*n

(B)BOOT xθθnI

B

1xH

Babu dan Singh (dalam Shao (1995))menunjukkan bahwa aproksimasi monte carlo

Page 4: Aproksimasi Interval Konfidensi Bootstrap. Haeruddin.pdfAproksimasi Interval Konfidensi Bootstrap Approximate Confidence Interval Bootstrap Haeruddin Program Studi Statistika FMIPA

Jurnal EKSPONENSIAL Volume 2, Nomor 1, Mei 2011 ISSN 2085-7829

Program Studi Statistika FMIPA Universitas Mulawarman 4

(B)BOOTH adalah second order accurate sebagai

estimator dari distribusi n, dengan

n

1nn

σ

EXX yang diringkas dalam

teorema berikut:Definisi 2.1.4

Jika X1, …, Xn sampel random iid dan

nnn σ/μX dan B adalah suatu fungsi

dari n yang memenuhi B/(log log n) → ∞ maka untuk n → ∞,

0XHXHsupn BOOT(B)BOOT

x

a.s

Interval KonfidensiHimpunan kepercayaanDefinisi 2.2.1

Misalkan X1, …, Xn sampel random iid darisuatu distribusi F yang tidak diketahui dan =T(F) parameter yang akan dicari intervalkonfidensinya.

Jika Cn = Cn(X1, …, Xn) subset dari yanghanya tergantung pada X1, …, Xn dan

1CθP n (2.2.1)

Definisi 2.2.2

Jika 1CθP n maka Cn disebut

sebagai himpunan kepercayaan dengan koefisienkepercayaan 1 – α atau himpunan kepercayaan 1– α.Definisi 2.2.3

Level yang diinginkan dalam suatu himpunankepercayaan disebut level nominal (nominalcoverage) yang biasanya diberikan. Biasanyadigunakan 1 – α dan 1 – 2α masing-masing sebagai level nominal dari interval konfidensi 1dan 2 sisi.Definisi 2.2.4

Misal I interval 1 sisi θ, atau ,θsedemikian hingga

α1IθP , maka:

(i) 1 – α disebut cakupan nominal dari I

(ii) IθP disebut coverage sesungguhnya

(iii) Coverage error dari I adalah

α1IθP Definisi 2.2.5

Jika {an} dan {bn} masing-masing barisanbilangan real, {Xn} dan {Yn} adalah barisanvariabel random, maka:a. an = O(bn) jika |an/bn| ≤ untuk semua n dan

suaru konstanta c.b. an = o(bn) jika an/bn → 0 untuk n → ∞

c. Xn = Op(Yn) jika M0ε , N

sehingga NnεM/YXP nn

d. Xn = Op(Yn) jika

0ε 0/YXLim nn n .

Dalam pembicaraan selanjutnya

dipertimbangkan suatu titik ujung θ interval satu

sisi yang mengcover 1 – α.

α,1θPDefinisi 2.2.6

Suatu himpunan konfidensi Cn dikatakanakurat asimptotik berorder k jika:

-1/2n nOα1CθP

Akibat 2.2.7

Titik konfidensi aproksimasi θ disebut akurat

asimptotik tingkat 1 (first order accurate) jika

-1/2nOα1θθP

Titik konfidensi aproksimasi θ disebut akurat

asimptotik tingkat 2 (second order accurate) jika

-1nOα1θθP Definisi 2.2.8

Suatu fungsi distribusi (x) dikatakan

simetris jika dan hanya xΨ1xΨ .

Contoh Φ(x), fungsi distribusi normal.

Ekspansi EdgeworthDalam pembahasan tentang tingkat akurasi

suatu titik konfidensi atau probabilitas cakupandari daerah kepercayaan, ekspansi Edgeworth danCornish Fisher sangat besar kontribusinya. Untukitu dalam pasal ini diberikan secara ringkastentang ekspansi-ekspansi tersebut, khususnyauntuk statistik yang akan dibahas dalam bab III.

Misalkan X1, X2, …, Xn variabel random iiddengan = μ dan varians σ2 < ∞. Estimasi dari

adalah i1

n Xnθ dengan varians n-1σ2.

Berdasarkan Teorema Limit Pusat,

/σθθnS nn ~ AN(0,1). Hall (1992)

memberikan ekspansi dari distribusi Sn sebagaideret pangkat dalam n-1/2 yakni:

...xpn

...xpnxΦx/σθθnP

jj/2

11/2

n

dimana

/2xeks2πx 21/2

adalah fungsi

densitas normal standar dan duuφxΦ

fungsi distribusi normal standarFormula (2.3.1) dikenal sebagai ekspansiEdgeworth. Fungsi pj adalah polinomial dengan

koefisien tergantung pada kumulan dari θθn .

Untuk mencari polinom-polinom dibuktikan dulubeberapa lemma berikut:

Page 5: Aproksimasi Interval Konfidensi Bootstrap. Haeruddin.pdfAproksimasi Interval Konfidensi Bootstrap Approximate Confidence Interval Bootstrap Haeruddin Program Studi Statistika FMIPA

Jurnal EKSPONENSIAL Volume 2, Nomor 1, Mei 2011 ISSN 2085-7829

Program Studi Statistika FMIPA Universitas Mulawarman 5

Lemma 2.3.1Jika X1, X2, …, Xn adalah sampel iid dari

distribusi dengan mean μ dan variansi

/σθXY,σ2 dan

/σθθnS nn maka

n

YSn ntt 2/1/ .

Definisi 2.3.2Untuk suatu variabel random umum Y dengan

fungsi karakteristik χY, kumulan ke j, κj, dari Y

didefinisikan sebagai koefisien dari jit

j!

1

dalam ekspansi dari deret pangkat log χY(t)dimana

...itκj!

1...itκ

2

1itκexpt

j

j

2

21Y

(2.3.2)Lemma 2.3.3

Untuk variabel random Y seperti dalamdefinisi diatas berlaku:

4422

22344

3

3233

222

1

612

3YE4YEκ

EYYE

YE2YEYE3YEκ

YVarYEYEκ

YEκ

EYYEYEYEYE

YEYE

Lemma 2.3.4Untuk Sn dan Y seperti didefinisikan

sebelumnya maka:

22t

Sn eitχ (2.3.3)

dengan:

itrn...itrnitrn1 jj/2

21

11/2

dimana:rj polinomial dengan koefisien real dengan

derajat 3j, tergantung pada κ3, κ4, …, κj+2 dantidak tergantung pada n yaitu:

623

442

331 u1/72κu1/24κur;uκ1/3!ur

Lemma 2.3.5Diberikan lemma 2.3.2 dan didefinisikan

22t

jjitx exrxdRe

dimana Rj(x) adalah

fungsi yang memiliki transformasi Fourier-

Stieltjes sama dengan 22t

j exr

maka distribusi

Sn dapat ditulis sebagai:

...xRn

...xRnxΦxSP

jj/2

11/2

n

Teorema 2.3.6 (Metode Delta untuk EkspansiEdgeworth)

Jika Sn dan Tn dua statistik yang masing-masing berdistribusi Normal Asimptotik yang

memenuhi j/2pnn nOTS untuk setiap j ≥

1 maka Ekspansi Edgeworth distribusi Sn dan Tn

hanya berbeda dalam suku-suku berorder n-j/2 ataulebih kecil, yakni:

j/2pnn nOxTPxSP

Ekspansi Cornish-Fisher

Misalkan /σθθnS nn dan

nσ/θθnT nn merupakan statistik yang

dapat diekspansi dalam Ekspansi Edgeworth

Misal

k

1i

1)/2(k-i

1/2

nn

nOxxpn

xΦxSPxH~

dan

k

1i

1)/2(k-i

1/2

nn

nOxxqnxΦ

xSPxG

Maka kuantil dari xH~

dan Gn dapat diekspansi

sebagai deret dalam n-j/2 berikut:

k

1i

1)/2(k-i

1/21-n nOzpnzxH

~

k

1i

1)/2(k-i

1/21-n nOzqnzyG

Dengan zα, xα, yα didefinisikan sebagai:

αnαnα yTPxSPzΦ dan

pj1 dan qj1 polinom ganjil(genap) dengan derajarj+1 jika j genap(ganjil) dan dapat dinyatakandalam pj dan qj.Ekspansi (2.4.1) dan (2.4.2) disebut sebagaiekspansi (invers) Cornish-Fisher.Teorema 2.4.1

Diberikan Ekspansi Edgeworth dari xH~

n

dan Cornish-Fisher xH~ 1

n

seperti dalam

definisi dimuka, maka:

xpxp 111 , dan

xpx1/2xpxpxpp 2

2

1'1121

(2.4.3)

Page 6: Aproksimasi Interval Konfidensi Bootstrap. Haeruddin.pdfAproksimasi Interval Konfidensi Bootstrap Approximate Confidence Interval Bootstrap Haeruddin Program Studi Statistika FMIPA

Jurnal EKSPONENSIAL Volume 2, Nomor 1, Mei 2011 ISSN 2085-7829

Program Studi Statistika FMIPA Universitas Mulawarman 6

INTERVAL KONFIDENSI BOOTSTRAPMotivasi Interval Bootstrap

Jika θ,θI interval konfidensi untuk

kuantitas dan fungsi monoton naik yangdiketahui maka sangat ideal bila kita berharap

bahwa θ,θI merupakan interval

konfidensi untuk (). Sebaliknya jika

θ,θ merupakan interval dari () maka

invers dari masing-masing titik ujung intervaltersebut merupakan interval dari . Dengan katalain bersifat transformasi repecting. Intervalyang dihasilkan oleh pendekatan di atasdidasarkan asumsi adanya tansformasi sedemikian hingga

0,1AN~xθˆP .

Kesulitan dalam pendekatan metode standarberdasarkan transformasi adalah bahwa kita harusmengetahui transformasi yang berbeda untuksetiap parameter yang akan diestimasi.

Diinginkan membangun interval konfidensidengan sifat transformasi respecting namun tanpaperlu mencari/mengetahui transformasi tersebut.Dengan kata lain metode ini dapat dipandangsebagai metode yang selalu “tahu” transformasiyang diperlukan. Metode ini dikerjakan denganperhitungan bootstrap, tanpa perlu mengetahui .

Interval Persentil BP

Misalkan nθ estimator dari dari suatu

distribusi F dan*nθ estimator bootstrap dari

berdasarkan*n

*2

*1 X...,,X,X sehingga fungsi

distribusi kumulatif dari*nθ adalah:

**

θ

*n

*BOOT θdθfxθPxK (3.2.1)

Maka interval persentil bootstrap didefinisikansebagai:

α)(1*n

(αα*n

1BOOT

1BOOT θ,θα1K,αK (3.2.2)

dengan )*(n

1BOOT θαK

adalah persentil ke

100.α dari distribusi bootstrap. Ekspresi (3.2.2) merujuk kepada situasi dimana replikasi bootstraptak hingga (bootstrap ideal). Dalam praktek kitaharus menggunakan cacah replikasi B yangberhingga, sehingga didapat interval aproksimasipersentil bootstrap:

α)*(1n

*(α(n

1BOOT

1BOOT

θ,θ

α1K,αK,

BPBP

dimana)*(

nθ adalah persentil ke 100.α dari

nilai-nilai b*θ yakni nilai ke B.α dalam daftar

urutan B replikasi dari*θ . Jika B.α tidak bulat

maka quantile empirik α dan 1 – α didefinisikan masing-masing sebagai nilai terbesar ke k dan ke

(B+1-k) dari b*θ dengan k = [(B+1).α],

bilangan bulat terbesar ≤ (B+1).α. Karena sifat similaritas diantara batas-batas

interval untuk pembicaraan selanjutnya hanyadibahas batas bawah interval saja.Teorema 3.2.1

Jika ada transformasi naik (x) sedemikian

hingga untuk semua F (dan F ) yang mungkinberlaku:

xψxθˆP

dimana θˆ dan (x) adalah fungsi

distribusi kontinu, naik dan simetris maka:Jika dan diketahui maka batas bawah exactuntuk adalah:

α1

EX zˆθ , dengan αψz 1α

Teorema 3.2.2Jika asumsi seperti pada teorema 3.2.1

dipenuhi untuk F maka:

EXBP θθ . Dimana BPθ batas interval persentil

bootstrap.Teorema 3.2.2 menunjukkan bahwa batas bawahinterval persentil bootstrap adalah exact untuksemua n jika asumsi pada teorema 3.2.1 tepatdipenuhi (dipenuhi secara exact). Umumnyaasumsi tersebut dipenuhi secara asimptotik untukn besar maka batas bawah persentil tersebutadalah valid secara asimptotik dan penampilannyatergantung pada bagaimana baiknya aproksimasitersebut. Namun, biasanya tidak linier dan bias

θˆ tidak menuju nol secara cepat untuk

n → ∞. Akibatnya asumsi pada dipenuhi secaraaproksimasi, aproksimasi ini baik hanya untuk ncukup besar. Aproksimasi yang biasa dipakaiadalah aproksimasi normal.

Interval Persentil BCInterval Persentil BC (Bias Corrected)

diturunkan dengan asumsi yang lebih umum dariteorema 3.3.1 dengan memasukkan suku koreksibias dalam asumsi tersebut.Teorema 3.3.1

Andai ada transformasi naik sedemikian

hingga untuk semua F (dan F ) yang mungkin

memenuhi. xψxzθˆP 0 dengan z0 konstanta yang mungkin tergantung

pada F dan n. Jika dan z0 serta diketahui

Page 7: Aproksimasi Interval Konfidensi Bootstrap. Haeruddin.pdfAproksimasi Interval Konfidensi Bootstrap Approximate Confidence Interval Bootstrap Haeruddin Program Studi Statistika FMIPA

Jurnal EKSPONENSIAL Volume 2, Nomor 1, Mei 2011 ISSN 2085-7829

Program Studi Statistika FMIPA Universitas Mulawarman 7

maka: α01

EX zzˆθ (3.3.1)Teorema 3.3.2

Misalkan ada seperti pada teorema 3.3.1,maka konstanta bias z0 adalah:

nBOOT1

0 θKψz (3.2.2)

Teorema 3.3.3

Dengan EXθ seperti yang didapat di atas

maka EXθ dapat dinyatakan sebagai:

0α1

BOOTEX 2zzΦKθ

Untuk membuktikan teorema di atas dibuktikandulu lemma berikut:Lemma 3.3.4

Untuk setiap x, 0 < x < 1 berlaku:

0111

BOOT zxψˆxK (3.3.4)

Teorema 3.3.5Batas bawah interval Persentil BC untuk

adalah:

nBOOT1-

α1

BOOTBC θK2ψzψKθ

KonsistensiBerdasarkan konsistensi dari distribusi

bootstrap maka dapat ditunjukkan konsistensihimpunan kepercayaan bootstrap.Teorema 3.4.1

Jika xθθnPH nn , HBOOT(x)

bootstrap dari Hn, dan andaikan bahwa HBOOT

konsisten serta H,Hρlim nn

untuk suatu

fungsi distribusi kontinu, stricly increasing dansimetri H maka:

BCBP θ,θ adalah konsisten.

Perbandingan Teoritis Interval KonfidensiDalam pasal ini akan dilihat tingkat akurasi

dari interval-interval konfidensi yang diterangkandi muka dan yang dihasilkan dengan pendekatannormal. Untuk membandingkan sifat-sifattersebut maka distribusi dari statistik dan titikkritisnya terlebih dahulu dinyatakan dalamekspansi Edgeworth dan ekspansi Cornish Fisher.

Titik kritis interval konfidensiDalam penjelasan ini diperhatikan kasus

dimana X1 iid dan = μ = EX1, nn Xθ dan

i1

n XnX . Andaikan g terdifferensial dan

kontinu pada p dan 0μg maka varians

asimptotik dari θθn n dan estimatornya

masing-masing adalah:

μg'μgnσ -12n dan

nn-12

n Xgˆ'Xgnσ dimana Σ = var(Xi) dan

'X-XX-Xnˆn1n1

-1Lemma 3.5.1

Misalkan Gn dan nH~

masing-masing

distribusi pivotal studentized nn ˆ/ˆ dan

variabel standardized nn /ˆ . Misalkan

αH~

x 1nα , αGy 1

α dan

1z [analog untuk indeks 1 – α],

BOOTH~

versi bootstrap dari nH~

maka batas

bawah NORθ , EXθ , BPθ dan BCθ masing-

masing adalah:

(i) α1Φσθzσθθ 1nnα1nnNOR

(ii) α1Gσθyσθθ 1nnα1nnEX

(iii) αH~

σθxσθθ 1BOOTnnαnnBP

(iv) BC1BOOTnnBCnnBC αH

~σθxσθθ

dengan 0αBC z2zΦα ,

nBOOT1

0 θKΦz

Ekspansi Edgeworth dan Ekspansi CornishFisher

Gn(x) dan xH~

n dapat diekspansi Ekspansi

Edgeworth sebagai:

3/2

21

11/2

n

nO

xxqnxxqnxΦxG

(3.5.5)

3/2

21

11/2

n

nO

xxpnxxpnxΦxH~

(3.5.6)dengan ekspansi (invers) Cornish Fisher dari

αGy 1nα dan xH

~x 1

nα adalah:

3/221

111

1/2

-1n

nOxxqnxxqnz

Gy

(3.5.7)

3/221

111

1/2

-1n

nOxxpnxxpnz

H~

x

(3.5.8)Versi bootstrap dari ekspansi di atas adalah:

Page 8: Aproksimasi Interval Konfidensi Bootstrap. Haeruddin.pdfAproksimasi Interval Konfidensi Bootstrap Approximate Confidence Interval Bootstrap Haeruddin Program Studi Statistika FMIPA

Jurnal EKSPONENSIAL Volume 2, Nomor 1, Mei 2011 ISSN 2085-7829

Program Studi Statistika FMIPA Universitas Mulawarman 8

3/2

21

11/2

BOOT

nO

xxqnxxqnxΦxG

(3.5.9)

3/2

21

11/2

BOOT

nOxxpn

xxpnxΦxH~

(3.5.10)

3/221

1

111/2-1

BOOT

nOxxqn

xxqnzGy

(3.5.11)

3/221

1

111/2-1

BOOT

nOxxpn

xxpnzH~

x

(3.5.12)Lemma 3.5.2

Dari hasil ekspansi-ekspansi di atas maka

titik-titik kritis NORθ , EXθ , BPθ dan BCθ dapat

dinyatakan dalam ekspansi-ekspansi berikut:

(i) α1nn1

nnNOR zσθα1Φσθθ

(ii)

1pα-111

1/2α-1nn

1nnEX

Ozqnzσθ

α1Gσθθ

n

(iii)

1pα-111

1/2α-1nn

-1BOOTnnBP

Ozpnzσθ

αH~

σθθ

n

(iv)

1pα-111

1/2

α-111/2

α-1

nn

BC-1BOOTnnBC

Ozpn

zp2nzσθ

αH~

σθθ

n

Tingkat Akurasi Interval KonfidensiBootstrap

Dalam pasal ini akan ditunjukkan bahwainterval konfidensi Persentil BP dan BCmempunyai tingkat akurasi pertama (first orderaccurate). Disamping itu juga ditunjukkan bahwaInterval bootstrap BC lebih baik dari aproksimasinormal ditinjau dari coverage error dari intervaltersebut.Teorema 3.5.3

Jika BPθ , BCθ adalah interval-interval

bootstrap seperti pada lemma 3.5.1 maka:

1/2BP nOα1,θθP dan

1/2BC nOα1,θθP

Coverage Error Interval KonfidensiInterval-interval satu sisi yang dihasilkan oleh

metoda bootstrap persentil BP, BC danAproksimasi Normal adalah dari tingkat akurasi

pertama. Ketiga interval tersebut dapatdibandingkan dengan melihat error dalamprobabilitas cakupannya.Untuk titik kritis Bootstrap Persentil:

αH~

σ

θθPθθ 1

BOOT

n

BPP

1α2α nO

n6

z1z31

(1)

Untuk titik kritis Bootstrap BC:

11α1

1/2αBP nO02pzpnzPθθP

1α2α nO

n6

z2z1

(2)

Untuk titik kritis dengan pendekatan normal:

α

n

NOR zσ

θθPθθP

1α2α nO

n6

z12z1

(3)

Misalkan 1Pe error

dalam probabilitas cakupan untuk batas bawah

kepercayaan . Maka dari (1), (2) dan (3)

didapat:

1αnNORBP nOzΑθθ ee dan

1αnBCNOR nOzΑθθ ee

dengan

n6

zφ1zγzΑ α

αn

Dengan asumsi γ ≠ 0, Bila 12 z maka

0 zn sehingga bootstrap BC lebih baik

dari aproksimasi normal yang lebih baik daribootstrap persentil BP ditinjau dari harga mutlakdari error probabilitas cakupan.

APLIKASI DAN SIMULASITeori Asimptotik Koefisien Korelasi

Dalam bab ini diberikan contoh penggunaandari metode penkonstruksian masin-masinginterval yang diterangkan pada Bab III untukkoefisien korelasi ρ dari (X,Y). Misalkan (Xi,Yi),…, (Xn,Yn) adalah n sampel random iidberdistribusi bivariat dari suatu populasi denganfungsi distribusi tidak diketahui F pada

2 dengan EX1 = μx = dan EY1 = μY, var(X1) =2x , cov(X,Y) = σXY. Misalkan ρ = ρ(F)

koefisien korelasi dari (X,Y) parameter yang akandiestimasi yang didefinisikan sebagai:

Page 9: Aproksimasi Interval Konfidensi Bootstrap. Haeruddin.pdfAproksimasi Interval Konfidensi Bootstrap Approximate Confidence Interval Bootstrap Haeruddin Program Studi Statistika FMIPA

Jurnal EKSPONENSIAL Volume 2, Nomor 1, Mei 2011 ISSN 2085-7829

Program Studi Statistika FMIPA Universitas Mulawarman 9

1/222

YX

XY

EYEE,EXXE

EYYEXXE

σσ

σρ

(4.1)

Dengan nρ estimator dari ρ yakni koefisien

korelasi sampel:

1/2

2

n

2

n

nn

YY,XXn

1

YYXXn

1

ˆ

n (4.2)

Yang dapat dihitung bila nilai observasidiberikan.Teorema 4.1

Koefisien korelasi sampel nρ merupakan

estimator konsisten konsisten dari ρ yakni jika

22 0,0 YEXE , maka

nσ,ρ a.sn .

Bukti:(i) Karena E(X2) < ∞ maka dengan SLLN

2X

a.s2nX

a.sn μXμX (1)

Akibatnya:

0μX0μX a.sXn

a.sXn

Telah diketahui bahwa:

2Xσa.s2

2Xn

1X2μ2X

n

1XμnX

n

1

Dengan Lemma Slutsky

2X

a.s2n

22nX σXX

n

1S dan

dengan mengambil g(x) = x1/2 didapat:

Xa.s

nX σS (2)

(ii) Analog dengan (i) didapat

Ya.s

nY σS (3)

(iii) YXa.s

nn μμYX (Dengan Lemma

Slutsky)

XYσa.sYμXμYXμ

Xn

1YμXY

n

1

YμnYXμnXn

1

Maka dengan Lemma Slutsky:

YXXYa.s μμσXY

n

1

(4)

XYa.s

nn

nn

YnXn

σYX

Yn

1XX

n

1YXY

n

1

μYμXn

1

(5)Dari (1) sampai (5) dan dengan Lemma

Slutsky maka didapatkan bahwa:

σρ a.sn

Misalkan ρρn nn kuantitas statistik

maka fungsi distribusi Exact dari n adalah

xρρnPxG n1/2

n untuk -∞ < x <

∞. Karena F tidak diketahui maka Gn tidakdiketahui, sehingga perlu diestimasi.Teorema 4.2

Jika 41EX , 4

1EY maka

2dn τ0,Nρρn

Bukti:

Misalkan Z1= 112

11211 YX,Y,Y,X,X adalah iid

dan μ= 112

11211 YEX,EY,EY,EX,EX

Dengan Teorema Limit Pusat Lindeberg-Levyuntuk kasus multivariat, maka untuk {Zi}, I = 1,2, …, n iid berdistribusi bersama F dan EZ1 = μ, Var(Z1) = Σ, maka:

0,NμZ

n

1n d

i

Dengan Σ matriks varians-covarians simetrik:

XYVarXY,YCovXYY,CovXY,XCovXYX,Cov

XY,YCovYVarYY,CovY,XCovYX,Cov

XYY,CovYY,CovYVarY,XCovYX,Cov

XY,XCovY,XCovY,XCovXVarXX,Cov

XYX,CovYX,CovYX,CovXX,CovXVar

22

222222

22

222222

22

Dengan elemen dari Σ adalah:

1) 2X11 σEXXEXVar

2) 2XX

3X

31

31

31

2 μμXEEXXEXX,Cov 2XX30 μ M

3) 2XX

3X

31

21

21

2 σμ-μ-XEEXXEXVar 4X

2X

2X30X40 σσ4μM4μM

4) YXY1X1 σρσμYμXEYX,Cov

5) Y12X

2X

21

2 μYμσXEY,XCov

YXX21 σσ2ρM

6) YY1 σμYEYVar

7) YXX212 σσ2ρMYX,Cov

(Analog dengan 5)

Page 10: Aproksimasi Interval Konfidensi Bootstrap. Haeruddin.pdfAproksimasi Interval Konfidensi Bootstrap Approximate Confidence Interval Bootstrap Haeruddin Program Studi Statistika FMIPA

Jurnal EKSPONENSIAL Volume 2, Nomor 1, Mei 2011 ISSN 2085-7829

Program Studi Statistika FMIPA Universitas Mulawarman 10

8) 2YYμ1Y

2Xμ

2Xσ

21XE

2Y,

2XCov

2Y

2X

YXYX12X21Y22

σσ

σσμ4μM2μM2μM

9) 2YY03

2 μYY,Cov M

(Analog dengan (2))

10) 4Y

2Y

2Y03Y04

2 σσ4μM4μMYVar

(Analog dengan (3))

11) 1111X1 YEXYXμXEXYX,Cov

YXX2XY21 σρμσμM

12) 1Y1EX1Y1X2xμ

221XEXY,

2XCov x

YX2X

2XYX

Y2X21X30Y31

σσ2ρρσμ2μ

σρσM3μMμM

13) YXX2YX12 σρμσμMXYY,ov C

(Analog dengan 11)

14)

YX2Y

2YYX

3XX

12Y03X132

σσ2ρρσμ2μσρσ

M3μMμMXY,YCov

(Analog dengan 12)

15) YXYX11

1111

μμσρσYXE

YEXYXEXYVar

21MY2μ12MX2μ2Yσ

2Xμ

2Xσ

2Yμ22M

22X

2YXYX σσρσσμ2ρ Y

Dengan bY

a

Xab μYμXEM

Misalkan 54321,T q,q,q,qqq

ii

2i

2i YX

2

1,Y

n

1,Y,X

n

1,X

Maka (4.3) dapat ditulis sebagai:

0,Nqn d (4.4)

Definisikan fungsi d2:rsedemikian hingga koefisien korelasi dapatdibentuk sebagai suatu fungsi rata-rata observasi,yakni:

1/22

34

1/2212

213n

qqqq

qqqqrρ

dan (4.1)

dapat ditulis sebagai μrρ .

Karena r(.) kontinu dan terdifferensial, denganmenggunakan ekspansi Taylor multivariat makadidapat bentuk berikut: Efron & Tibshirani, 1993)

nii

i

5

1iii Rμq

q

qrμqμrqr

(4.5)

dimana Rn, suku sisa dengan order lebih kecil dari(qi – μi) i = 1, 2, 3, 4, 5.

Misalkan μqμrT

sebagai perkalian

vektor dari suku kedua dari persamaan di sebelahkanan (4.5), kemudian persamaan itu dikalikan

dengan n dan ditulis:

n

T

n Rnμqμrρρn

Dari (4.4) 0,AN~qn , maka

dengan “Cramer Wold device” (Teorema 2.5.5)dapat disimpulkan:

2d τ0,Nμqμrn T

dan

varians2 dapat dicari dengan metode delta:

μrμrτT2

(4.7)

Karena μqn asimptotik normal dan Rn

berorder lebih kecil dari (q – μ) maka

0n dnR , sehingga dengan menggunakan

lemma Slutsky pada (4.6) maka:

2dn τ0,Nρρn

Dari (4.7), dengan menghitung turunan parsialdari r(q) untuk q = μ didapat:

YX2YYX

Y2YYX

Y2X

XT

σσ

1,

ρ,

σσ

ρμ

ρ,

σσ

μ

σ

ρμμr

54321

Tτ,τ,τ,τ,τμr dengan:

21

YX

122Y

302X

1 Mσσ

1M

ρM

ρτ

21

YX

X31

YX

122X

X

222Y

302X

X402

X

2

Mσσ

2μM

σσ

1M

σ

ρμ

M2σ

ρM

σ

ρμM

ρτ

12

YX

032Y

212X

3 Mσσ

1M

ρM

ρτ

12

YX

Y13

YX

032X

Y

042Y

212X

Y222

X

4

Mσσ

2μM

σσ

1M

σ

ρμ

M2σ

ρM

σ

ρμM

ρτ

03M2Xσ

Xρμ

30M2Yσ

Yρμ

12M2Y2σ

21M2X2σ

Xρμ

03M2Y2σ

ρ

31M2X2σ

ρ5τ

Page 11: Aproksimasi Interval Konfidensi Bootstrap. Haeruddin.pdfAproksimasi Interval Konfidensi Bootstrap Approximate Confidence Interval Bootstrap Haeruddin Program Studi Statistika FMIPA

Jurnal EKSPONENSIAL Volume 2, Nomor 1, Mei 2011 ISSN 2085-7829

Program Studi Statistika FMIPA Universitas Mulawarman 11

21

YX

Y12

YX

X22

YX

Mσσ

μM

σσ

μM

σσ

1

Maka varians asimptotik dari ρρn n adalah:

22M2Yσ

2Xσ

1

22M2Yσ

2Xσ

04M4X4σ

40M4X4σ

2ρ2

τ rT

r

133YX

31

Y3X

Mσσ

ρM

σσ

ρ

3YX

13

Y3X

31

2

YX

22

2Y

2X

22

4X

04

4X

40

2

σσ

4M

σσ

4M

σσ

4M

σσ

2M

σ

M

σ

M

4

ρ

(4.8)

dimana Mab adalah momen sampel.

Misalkan nρ koefisien korelasi sampel dan

ρρnσ n2 estimator plug in dari

2 ,

maka estimator varians dari nρ adalah estimator

koefisien secara kuat untuk2 .

Teorema 4.3

Misalkan n2 ρσ estimator plug ini dari

varians koefisien korelasi, jika 1EX ,

1EY , 02 X , dan 02 Y maka

2a.sn

2 τρσn untuk n → ∞

Bukti:Dari teorema (4.2)

2dn

2 τ0,ρρσn N

Misalkan n2 ρσn estimator plug in

2n

2 τρσn , maka:

3YX

13

Y3X

31

2

YX

22

2Y

2X

22

4X

04

4X

40

22

σσ

M4

σσ

4M

σσˆ

M4

σσ

M2

σ

M

σ

M

4

ρˆ

Dari teorema (4.1) a.snρ , dan dengan

SLLN2X

a.s2X σσ dan

2Y

a.s2Y σσ , dan

dengan mengambil g(x) = x1/2 serta g(x) = x3/2

akan memberikan Xa.s

X σσ ,

3X

a.s3X σσ , Y

a.sY σσ ,

3Y

a.s3Y σσ .

Juga dengan SLLN

bY

a

X

aba.sb

ni

a

niab

μYμXE

MYYXXn

1M

Mengingat teorema tentang konvergensi dari

jumlah dan hasil kali, jika 02 X dan 02 Ydidapat:

2a.sn

2 τρρσn untuk n → ∞.

Untuk kasus parametrik maka diasumsikanpopulasi berdistribusi normal bivariat.Teorema 4.4

Jika F adalah ΦμX,Μy,σX,σY,ρ distribusi Gaussian

dengan mean

Y

X

μ

μμ dan covarian matrik

2YYX

YX2X

σσρσ

σρσσ

Varians2 adalah 22ρ1 .

Bukti:

Misalkan

Y

Y

X

X

σ

μY

σ

μX

Y~X~

, maka

ρ1,

0

0N~

Y~X~

Jika (4.7) dipenuhi maka ada matrik P2x2 yang

memenuhi 2T IP

ρ1P

sedemikan hingga:

ρ1,

0

0N~

Y~X~

2

1

Z

Z

Dengan menggunakan operasi matrik pada akardan vektor karakteristik, maka didapat P yakni,

ρ1

1

ρ1

1ρ1

1

ρ1

1

2

1P

Karena Z1 dan Z2 iid Normal maka:

1ZEZ0,ZEZZEZ3,EZEZ 32

312

31

321

42

41

akibatnya:3YX13 σ3ρM ; Y

3X31 σ3ρM

dan 2Y

2X22 σ2ρ1M (4.12)

Karena X~

dan Y~

normal standar maka:4X40 3M ; dan

4Y04 3M

Page 12: Aproksimasi Interval Konfidensi Bootstrap. Haeruddin.pdfAproksimasi Interval Konfidensi Bootstrap Approximate Confidence Interval Bootstrap Haeruddin Program Studi Statistika FMIPA

Jurnal EKSPONENSIAL Volume 2, Nomor 1, Mei 2011 ISSN 2085-7829

Program Studi Statistika FMIPA Universitas Mulawarman 12

Dengan mensubstitusikan (4.12) dan (4.13) ke

(4.8) didapat 22 2ρ1 (Ausri, dkk:1995)

Untuk dapat membandingkan denganinterval Persentil perlu dicari sedemikianhingga asumsi pada interval persentil dipenuhi.

Teorema 4.5Jika F adalah ΦμX,Μy,σX,σY,ρ pada teorema (4.3),

maka ada fungsi dan estimasinya yangterdifferensial dan kontinu sedemikian hingga

0,1~ρρn n N .

Bukti:

Karena 2

nd

n ρρ0,ρρn Nmaka dengan metode delta:

22

nd 'ρρ0,ˆn N

(4.12)Varians dari distribusi diatas = 1 jika

22

n 'ρρ sehingga2ρ1

1'

dan

Cρ1

ρ1log

2

1

, C konstan.

Bootstrap Koefisien Korelasi

Misalkan 11 Y,X , i = 1, 2, …, n sampel

bootstrap iid dari distribusi empirik nF yang

diambil dengan pengembalian dari sampel ukurann. Maka versi bootstrap untuk sampel korelasiadalah:

1/2

2*n

*i

2*n

*i

*n

*i

*n

*i

YY,XXn

1

YYXXn

1

ˆ

n

Interval Konfidensi Koefisien Korelasia. Pendekatan Normal Standar

Jika x

τ

ρρnPxG n

ρ

, dengan

menggunakan pendekatan normal

1/2ρ nOxΦxG didapat interval

konfidensi 1 - 2α aproksimasi normal standar:

n

τρ,

n

τρ n1n zz dengan

estimator dari .

b. Dengan Transformasi Normal Standar

Pilih

ρ1

ρ1log

2

1 dengan

0,1N~ˆn n didapat interval untuk

yaitu:

α11/2

nα1/2

n znˆ,znˆ

Interval untuk ρ diperoleh dengan menginverskan interval (4.13) dengan menggunakan tangenhiperbolik.

c. Interval Aproksimasi Bootstrap PersentilInterval Persentil didapat dengan menghitung

persentil α dan 1 – α dari replikasi bootstrap dari *nρ . Untuk B = 100 maka batas interval 95%

untuk ρ adalah nilai ke 25 dan 975 masing-masing

untuk batas bawah dan atas dari replikasi*nρ

yang telah diurutkan.d. Interval Bootstrap Persentil BC

Interval Persentil BC diperoleh dengan carayang sama seperti pada Interval BootstrapPersentil kecuali α pada Interval Persentil diganti

dengan αBC dengan α0BC zz2Φα dan

α-10BC zz2Φα-1 serta

n*nn

10 ρρρProbΦz

atau

B

ρbρ#Φz n

*1

0

Program SimulasiSimulasi untuk interval bootstrap BP dan BC

menggunakan S-Plus dengan bantuan komputer.Untuk simulasi dibangun sampel random denganukuran n. Beberapa input yang diperlukan antaralain: n (ukuran sampel, R1 dan R2 (2 sampelrandom independen dari distribusi normal denganmean μ dan varians σ2), B (cacah replikasi), rh(koefisien korelasi populasi). Untukmengkontruksi sampel random normal bivariatdengan mean μ = (μX, μY) dan varians

2YXY

XY2X

σσ

σσdigunakan transformasi

(Efron & Tibshirani, 1993):X = μX + σX R1

212

YY CRR

c1

σμY

dengan

1C

2

Dalam simulasi ini diambil μX = μY = 0 dan

122 YX .

Langkah-langkah proses simulasi:1. Definisikan semua statistik yang diperlukan.

Page 13: Aproksimasi Interval Konfidensi Bootstrap. Haeruddin.pdfAproksimasi Interval Konfidensi Bootstrap Approximate Confidence Interval Bootstrap Haeruddin Program Studi Statistika FMIPA

Jurnal EKSPONENSIAL Volume 2, Nomor 1, Mei 2011 ISSN 2085-7829

Program Studi Statistika FMIPA Universitas Mulawarman 13

2. Bangun dua sampel random normalindependen R1 dan R2 dengan ukuran n.

3. Gunakan transformasi (4.2.1) dan (4.2.2)untuk membangun distribusi normal bivariat.

4. Hitung n dan .

5. Kontribusi interval konfidensi untuk ρ dengan aproksimasi normal standar dandengan transformasi.

6. Kontruksi interval konfidensi untuk ρ dengan metoda bootstrap persentil dan persentil BCmenggunakan cacah replikasi B.

7. Buat histogram dari semua intervalkonfidensi.

Selain simulasi interval konfidensi untukkoefisien korelasi diberikan juga simulasisederhana interval konfidensi untuk parameter =eμ, dengan μ mean populasi dan sampel diambil dari distribusi normal standar X1, …, X10. Sebagaipembanding tetap dihitung interval konfidensidengan pendekatan normal standar dantransformasi normal , yakni = log x. Langkah-langkah simulasi analog seperti pada koefisienkorelasi tetapi lebih sederhana dan pembahasansecara teoritis tidak diberikan.

KESIMPULAN DAN SARANBerdasarkan pembahasan yang telah

diuraikan sebelumnya, maka dapat disimpulkanbahwa interval konfidensi berdasarkan PersentilBootstrap bersifat transformation-respecting yangtidak dimiliki oleh interval normal standar.Disamping itu dalam membangun intervaltersebut kita tidak perlu tahu transformasi yangdigunakan karena dikerjakan langsung dariperhitungan bootstrap. Semua interval yangdibahas dimuka termasuk interval Normal Standarmempunyai tingkat akurasi pertama namun dalamhal coverage error, interval Persentil BCmempunyai error yang lebih kecil dibandingkandengan interval normal dan interval Persentil BP.Metode Persentil kelihatan lebih praktis dalampenerapannya dan tidak menyimpang daripendekatan tradisional.Berdasarkan hasil penelitian Efron (1987) intervalPersentil dapat ditingkatkan akurasinya denganasumsi yang lebih umum. Masalah ini tidakdibahas mengingat waktu dan kemampuanpenulis yang terbatas, sehingga disarankan untukmelakukan penelitian tentang hal itu.

DAFTAR PUSTAKABickel, P.J. and Freedman, D.A, 1981, Some

Asymptotic Theory For The Bootstrap. Annalsof Statistics. Vol. 9, No. 6, 1196-1217.

Diciccio, T. and Tibshirani, R, 1987, BootstrapConfidence Intervals and BootstrapApproximations. Journal of the AmericanStatistical Association, vol.82, No.397, 163-170.

Dudewicz, E.J. and Mishra, S.N., 1988, ModernMathematical Statistics John Wiley & Sons.New York.

Efron, B., 1979, Bootstrap Method: Another lookat the jacknife. Annals of Statistics, 7, 1 – 26.

--------, 1987, Better Bootstrap ConfidenceIntervals (with discussion). Journal fo theAmerican Statistical Association. Vol.82,No.397, 171-200.

Efron, B. and Tibshirani, R., 1993, AnIntroduction to the Bootstrap. Chapman &Hall. New York.

Hall, P., 1988, Theoretical Comparison ofBootstrap Confidence Intervals (withdiscussion). Annals of Statistics, 16, 927-953.

--------, 1992, The Bootstrap and EdgeworthExpansion. Springer-Verlag New York.

Helmers, R., 1995, Bootstrap Aproximation:Theory and Application. Unpublished Paper,Amsterdam.

Serfling, R. J., 1980, Approximation Theorems ofMathematical Statistics. Wiley, New York.

Shao, J. and Tu, D., 1995, The Jacknife andBootstrap. Springer Verlag New York.

Singh, K., 1981, On the Asymptotic Accuracy ofEfron’s Bootstrap. Annals of Statistics, Vol.9,No. 6, 1187-1195.

Statistical Sciences,Inc., 1993, S-PLUS forWindows’s User’s Manuals, Version 3.1,Seatle: Statistical Sciences, Inc.

Zulaela, at al., 1995, Bootstrapping LinearRegression Models, Research Workshop inStatistic. Unpublishing manuscript. Bandung.

Page 14: Aproksimasi Interval Konfidensi Bootstrap. Haeruddin.pdfAproksimasi Interval Konfidensi Bootstrap Approximate Confidence Interval Bootstrap Haeruddin Program Studi Statistika FMIPA

Jurnal EKSPONENSIAL Volume 2, Nomor 1, Mei 2011 ISSN 2085-7829

Program Studi Statistika FMIPA Universitas Mulawarman 14