Diktat StatMat I

download Diktat StatMat I

of 88

  • date post

    28-Oct-2015
  • Category

    Documents

  • view

    45
  • download

    6

Embed Size (px)

description

Diktat Statistika Matematika I

Transcript of Diktat StatMat I

  • DIKTAT KULIAHSTATISTIKA MATEMATIKA I

    Disusun Oleh

    Dr.rer.nat. Wayan Somayasa, S.Si., M.Si.

    FMIPA UNHALU-KENDARI

    KENDARI 2008

  • Table of Contents

    Table of Contents 1

    1 Statistik dan distribusi sampling 3

    1.1 Sampel random . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

    1.2 Statistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

    1.3 Distribusi sampling dari populasi normal . . . . . . . . . . . . . . . . 7

    1.3.1 Distribusi chi-kuadrat . . . . . . . . . . . . . . . . . . . . . . 9

    1.3.2 Distribusi t student . . . . . . . . . . . . . . . . . . . . . . . . 13

    1.3.3 Distribusi F . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

    1.4 Soal-soal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

    2 Estimasi titik 18

    2.1 Metode momen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

    2.2 Estimator dengan likelihood terbesar . . . . . . . . . . . . . . . . . 21

    2.2.1 Kasus satu parameter (k = 1) . . . . . . . . . . . . . . . . . . 22

    2.2.2 Kasus k parameter . . . . . . . . . . . . . . . . . . . . . . . . 23

    2.3 Keriteria-keriteria memilih estimator . . . . . . . . . . . . . . . . . . 26

    2.3.1 Ketakbiasan . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

    2.3.2 Keterkonsentrasian dan UMVUE . . . . . . . . . . . . . . . . 27

    2.4 Soal-soal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

    3 Statistik cukup, keluarga lengkap dan keluarga eksponensial 33

    3.1 Statistik cukup . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

    3.2 Keluarga lengkap . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

    3.3 Keluarga eksponensial . . . . . . . . . . . . . . . . . . . . . . . . . . 44

    3.4 Soal-soal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

    1

  • 24 Estimasi interval 47

    4.1 Metode kuantitas pivot (pivotal quantity) . . . . . . . . . . . . . . . . 50

    4.1.1 Membandingkan dua populasi normal . . . . . . . . . . . . . . 54

    4.2 Metode umum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

    4.2.1 Kasus h1 dan h2 monoton naik . . . . . . . . . . . . . . . . . 57

    4.2.2 Kasus h1 dan h2 monoton turun . . . . . . . . . . . . . . . . . 59

    4.3 Soal-soal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

    5 Uji hipotesis 62

    5.1 Pendahuluan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

    5.1.1 Menentukan daerah kritik . . . . . . . . . . . . . . . . . . . . 64

    5.1.2 Nilai p (p-value) . . . . . . . . . . . . . . . . . . . . . . . . . . 68

    5.2 Metode memilih tes terbaik . . . . . . . . . . . . . . . . . . . . . . . 70

    5.2.1 Tes UMP untuk hipotesis sederhana . . . . . . . . . . . . . . 70

    5.2.2 Tes UMP untuk hipotesis komposit . . . . . . . . . . . . . . . 73

    5.2.3 Keluarga monotone likelihood ratio (MLR) . . . . . . . . . . . 75

    5.3 Tes dengan membandingkan fungsi likelihood . . . . . . . . . . . . . . 79

    5.4 Soal-soal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

    6 Teori sampel besar 85

    7 Teori Bayes 86

    8 Estimasi dengan metode bootstrap 87

  • Chapter 1

    Statistik dan distribusi sampling

    Pada bagian ini kita akan membahas konsep tentang statistik (engl.: statistic) dan

    distribusi sampling. Harap diperhatikan perbedaan antara statistik dan statistika

    (engl.: statistics). Sebelumnya kita akan mengajak pembaca untuk membahas penger-

    tian sampel random dan peranannya dalam statistika.

    1.1 Sampel random

    Misalkan seorang peneliti tertarik untuk mengamati proporsi ikan tuna yang tersebar

    di teluk Kendari. Tentu saja proporsi ini tidak diketahui kecuali kalau si peneliti tadi

    bisa menghitung semua ikan yang hidup di teluk Kendari dan kemudian menghitung

    berapa bagian dari total jumlah ikan tadi yang merupakan ikan tuna. Apakah ini

    mungkin dilakuan? Berapa banyak waktu, biaya dan tenaga yang perlu diinvestasikan

    kalau cara ini yang ditempuh?

    Sebagai statistikawan kita bisa membantu si peneliti tadi dengan statistika seba-

    gai berikut. Kita misalkan populasi ikan di teluk Kendari sebagai ruang probabilitas

    3

  • 4(,F ,P). Misalkan T adalah himpunan semua ikan tuna, maka proporsi ikan tunadalam populasi itu adalah P(T ) = ]T] , yaitu jumlah ikan tuna dibagi jumlah ikan

    keseluruhan. Kita misalkan konstanta yang tidak diketahui ini sebagai p 0. Mis-alkan X : R adalah indikator dari T , yaitu suatu fungsi yang didefinisikansebagai berikut

    X() :

    {1 : jika T0 : jika 6 T

    .

    Maka X adalah sebuah variabel random (fungsi terukur) Bernoulli yang mengambil

    nilai pada ruang sampel (R,B,PX), dimana untuk setiap himpunan bagian B B,PX(B) := P{ : X() B}. Misalkan ambil kasus dimana B = {1}, makaPX({1}) := P{ : X() = 1} = P(T ) = p. Selanjutnya PX disebut sebagaidistribusi peluang dari X. Sebaliknya kalau B = {0}, maka PX({0}) := P{ :X() = 0} = P(CT ) = 1 p, dimana CT adalah komplemen dari T . Jadi modeldistribusi peluang ikan tuna di teluk Kendari di gambarkan oleh model distribusi

    peluang dariX dengan fungsi densitas fX(x) := PX({x}) = P{X = x} = px(1p)1x,x = 0, 1. Selanjutnya fX(x) disebut sebagai fungsi densitas populasi.

    Misalkan dari suatu eksperimen yang dilakukan misalkan dengan memancing ikan

    lalu mencatat hasilnya pada setiap pemancingan sebagi 1 jika yang didapat adalah

    tuna dan 0 jika hasilnya bukan ikan tuna. Andaikan pemancingan dilakukan n

    kali, maka data yang diperoleh adalah x1, . . . , xn, dengan xi {0, 1}, i = 1, . . . , n.Dalam statistika kita memandang data sebagai realisasi (nilai) dari variabel random

    X1, . . . , Xn yang terdefinisi pada (,F ,P), yaitu Xi() = xi, untuk suatu ,i = 1, . . . , n. Kita nyatakan distribusi peluang bersama dari X1, . . . , Xn dengan

    ni=1PXi yang terdefinisi pada (Rn,Bn).

    Definisi 1.1.1. Suatu himpunan random variable {X1, . . . , Xn} dikatakan sebagai

  • 5sampel random berukuran n dari suatu populasi X, jika dan hanya jika

    ni=1PXi{ni=1(, ti]} = ni=1PXi((, ti]) = ni=1PX((, ti]),

    dimana ni=1(, ti] := (, t1] (, tn]. Jika populasi X mempunyai fungsidensitas f(x), maka {X1, . . . , Xn} dikatakan sebagai sampel random berukuran n darisuatu populasi X, jika dan hanya jika

    fX1,...,Xn(x1, . . . , xn) = ni=1f(xi).

    Jadi suatu sampel random harus memenuhi kondisi dimana X1, . . . , Xn saling in-

    dependen dan masing-masing mempunyai distribusi peluang yang sama dengan dis-

    tribusi peluang populasinya (sering juga dikatakan i.i.d sebagai singkatan dari inde-

    pendent and identically distributed).

    Kembali ke kasus semula jika pada setiap pemancingan (trial) ikan dilepas lagi,

    maka hasil berikutnya tidak akan terpengaruh dari hasil sebelumnya (saling indepen-

    den) dan masing-masing akan mengikuti distribusi yang sama yaitu Bernoulli dengan

    parameter p. Jadi eksperimen kita akan menghasilkan sampel random berukuran n

    dari populasi ikan tuna di teluk Kendari.

    Sebagai contoh lain, misalkan suatu pabrik lampu dalam setahun memproduksi

    500000 lampu pijar dengan jenis yang sama, misalkan jenis A. Karena suatu hal,

    daya tahan lampu yang dihasilkan ternyata berbeda-beda. Andaikan produsen ter-

    tarik untuk menyelidiki proporsi lampu yang mempunyai daya tahan sesuai spesifikasi

    tertentu, misalkan daya tahannya melebihi t jam. Andaikan populasi lampu jenis A

    dimisalkan sebagai ruang (,F ,P) dan Y : (,F ,P) (R0,B(R0),PY ) dengan

  • 6Y () adalah daya tahan bola lampu . Andaikan Y mengikuti distribusi expo-nensial dgn parameter > 0, maka proporsi bola lampu jenis A yang daya tahan-

    nya lebih dari atau sama dengan t jam adalah PY ([t,)) = t

    1exp{y/}dy =

    exp{t/}, t 0. Andaikan Y1, . . . , Yn adalah sampel random dari populasi Y , makani=1PYi(ni=1[ti,)) = ni=1 exp{ti/} = exp{1

    ni=1 ti}.

    1.2 Statistik

    Pada subbab sebelumnya kita mengenal p dan sebagai konstanta-konstanta (parameter-

    parameter) yang tidak diketahui nilainya. Tujuan dari statistika adalah merumuskan

    suatu konsep inferensi atau pendugaan terhadap parameter-parameter tersebut. Alat

    utama yang digunakan adalah apa yang disebut statistik.

    Definisi 1.2.1. Misalkan {X1, . . . , Xn} adalah himpunan n N variabel randomteramati dari suatu populasi tertentu. Statistik adalah sembarang fungsi T :=

    t(X1, . . . , Xn) yang tidak bergantung pada sembarang parameter yang tidak diketahui.

    Selanjutnya distribusi dari suatu statistik disebut distribusi sampling.

    Catatan:

    Pada Definisi 1.2.1 kata teramati mengandung pengertian bahwa melalui suatu ekspe-

    rimen n titik data yang diperoleh adalah realisasi dari X1, . . . , Xn. Variabel-variabel

    ini harus teramati, karena kalau tidak, maka fungsi t tidak bisa dihitung.

    Contoh 1.2.2. Misalkan X1, . . . , Xn adalah sampel random dari suatu populasi den-

    gan mean dan variansi 2 > 0. Mean sampel X := 1n

    ni=1Xi and variansi

    sampel S2 := 1n1

    ni=1(Xi X)2 merupakan statistik dengan sifat-sifat sebagai

    berikut:

  • 71. E(X) = and V ar(X) = 2/n.

    2. E(S2) = 2 and V ar(S2) = 1n(4 n3n14), dengan 4 := E(X4).

    Untuk kasus penyelidikan ikan tuna di teluk Kendari, proporsi sampel adalah p :=

    1n

    ni=1Xi, dengan Xi i.i.d. Bin(1, p). Maka E(p) = p dan V ar(p) = p(1 p).

    1.3 Distribusi sampling dari populasi normal

    Pada bagian ini kita akan mempelajari distribusi dari beberapa statistik yang meru-

    pakan fungsi dari samp