Nama: Analisis Statistika (STK511)
SKS : 3 (2-2)
Referensi:1. Mattjik, A.A dan I M Sumertajaya. 2002. Perancangan Percobaan
dengan Aplikasi SAS dan Minitab, Jilid I. IPB Press. Bogor.
2. Montgomery, D.C. 1991. Design and Analysis of Experiments, 3rd ed. John Wiley & Sons, Inc. Singapore.
3. Steel, R.G.D., J.H. Torrie and D.A Dickey. 1997. Principles and Procedures of Statistics a Biometrical Approach, 3nd ed. McGraw-Hill, Inc. Singapore.
4. Aunuddin. 2005. STATISTIKA: Perancangan dan Analisis Data. IPB Press. Bogor
Penilaian : UTS, UAS, Tugas, Praktikum
PENDAHULUAN
• Apa itu statistika? • Statistika berasal dari kata statistik
penduga parameter• Ilmu yang mempelajari dan
mengusahakan agar data menjadi informasi yang bermakna
StatistikaPopulasi
Contoh
Sampling Pendugaan
Tingkat Keyakinan
Ilmu PeluangStatistika Deskriptif
vs Statistika Inferensia
Deskriptif
StatistikaPopulasi : Keseluruhan pengamatan yang menjadi pusat perhatian
kita
Contoh : Himpunan bagian dari populasi (mewakili)
Parameter : Karakteristik numerik dari populasi
Statistik : Karakteristik numerik dari contoh
Peubah / Variabel : Ciri dari objek yang diamati
Data : ?
Skala pengukuran : Nominal, Ordinal, Interval, Rasio
Peubah: Kualitatif vs Kuantitatif, Diskret vs Kontinu
Pengumpulan Data: Harus dibangkitkan dulu Percobaan Langsung dikumpulkan Survei/Observasi
Analisis Eksplorasi DataEksplorasi Upaya untuk melihat ke dalam data guna mengungkap
informasi yang terkandung dalam data tersebut
manipulasi, penyarian/perangkuman, peragaan
Peragaan : tabel & grafik (histogram, diagram batang, diagram lingkaran/pie chart, plot, dll.)
Penyarian: ukuran pemusatan (mean, median, modus, quartil), ukuran penyebaran (ragam, standard deviasi, range, jarak antar kuartil)
0102030405060708090
Tw-1 Tw-2 Tw-3 Tw-4
JabarJatimLampung
79%
21%
Laki-Laki Perempuan
400500600700800900
1000
20 40 60 80 100 120Jarak (1000 Km)
Em
isi H
c (p
pm)
Analisis Eksplorasi Data
Contoh: a. 3 9 7 4 10 3 b. 4 9 3 8 6
Mean rataan atau rata-rata Populasi Contoh
Median nilai yang membagi pengamatan menjadi dua bagian yang sama besar (50% < median, 50% > median)
Quartil nilai yang membagi pengamatan menjadi empat bagian yang sama besar (Q1 : 25% < Q1 & 75% > Q1, Q2=median, Q3 : 75% < Q3 & 25% > Q3)
Modus nilai yang paling sering muncul
⎥⎦⎤
⎢⎣⎡ +=
21nx ~x
⎥⎦⎤
⎢⎣⎡ +
=)1(
411 x
nQ
⎥⎦⎤
⎢⎣⎡ +
=)1(
433 x
nQ
∑=
=N
1i
i
Nx μ ∑
=
=n
1i
i
nx x
Ragam : Populasi Contoh
Standard Deviasi akar kuadrat dari ragam: Pop=σ , Contoh=s
Range atau Wilayah Selisih nilai terbesar dengan terkecilR = X[n] – X[1]
Jarak Antar Kuartil Selisih antara Q3 dengan Q1 (JAK=Q3-Q1)
Analisis Eksplorasi Data
∑=
−=
N
i N1
2i2 )(x μσ ∑
= −−
=n
i nxs
1
2i2
1)(x
2σσ = 2ss=
Contoh Data KaryawanNo Sex Tinggi Berat Agama
1 1 167 63 Islam
2 1 172 74 Islam
3 0 161 53 Kristen
4 0 157 47 Hindu
5 1 165 58 Islam
6 0 167 60 Islam
7 1 162 52 Budha
8 0 151 45 Katholik
9 0 158 54 Kristen
10 1 162 63 Islam
11 1 176 82 Islam
12 1 167 69 Islam
13 0 163 57 Kristen
14 0 158 60 Islam
15 1 164 58 Katholik
16 0 161 50 Islam
17 1 159 61 Kristen
18 1 163 65 Islam
19 1 165 62 Islam
20 0 169 59 Islam
21 1 173 70 Islam
Rekapitulasi menurut Sex
Sex Frek. Persen
Laki-laki 12 57.14
Perempuan 9 42.86
Rata-rata Tinggi & Berat
Tinggi Berat
Laki-laki 166.25 64.75
Perempuan 160.56 53.89
Gabungan 163.81 60.10
57%
43%
Laki-laki
Perempuan
61%19%
10%5% 5%
Islam Kristen Katholik Hindu Budha0.00
50.00
100.00
150.00
200.00
Tinggi Berat
Laki-laki
Perempuan
Penyajian Tabel
Penyajian Grafik
Rekapitulasi menurut Agama
Agama Frekuensi Persen
Islam 13 61.90
Kristen 4 19.05
Katholik 2 9.52
Hindu 1 4.76
Budha 1 4.76
Penyajian dengan: - Diagram Dahan Daun (Stem-and-Leaf Display) - Diagram Kotak Garis (Box-Plot)
Analisis Eksplorasi Data
Contoh data:
Analisis Eksplorasi Data
Stem-and-leaf of Contoh3 N = 23
Leaf Unit = 1.0
1 0 3
3 0 45
5 0 77
8 0 899
(4) 1 0011
11 1 223
8 1 4455
4 1 67
2 1 8
1 2
1 2
1 2
1 2 7
Stem-and-Leaf Display
Stem-and-leaf of Contoh1 N = 20
Leaf Unit = 1.0
1 2 5
4 3 579
7 4 138
(4) 5 0445
9 6 5569
5 7 36
3 8 12
1 9 3
Stem-and-leaf of Contoh2 N = 24
Leaf Unit = 1.0
3 0 899
7 1 0223
(6) 1 566779
11 2 01344
6 2 689
3 3 1
2 3 8
1 4
1 4
1 5 3
Analisis Eksplorasi DataBoxplot
Langkah Pembuatan Boxp-Plot:
1. Tentukan: nilai terkecil, nilai terbesar, Q1, Median, Q3
2. Lakukan identifikasi pencilan:
dekat: x < Q1 – 3/2 d atau x > Q3 + 3/2 d & jauh: x < Q1 – 3d atau x > Q3 + 3d
3. Gambar !
Peluang• Bagaimana membuktikan bahwa sebuah dadu setimbang?
• Empiris Peluang = frekuensi relatif
• Contoh:
• Satu mata uang setimbang dilempar sekaliRC = {M, B}P({M})=1/2 dan P({B})=1/2
• Satu mata uang setimbang dilempar 3 kaliRC = {BBB,BBM,BMB,MBB,BMM,MBM,MMB,MMM}P({MMM})=1/8 ; P({BBB})=1/8 ; P({BMB})=1/8X = Jumlah sisi muka yang muncul (X disebut peubah acak)
Peluang
P(X=0) = P({BBB}) = 1/8P(X=1) = P({BBM,BMB,MBB}) = 3/8P(X=2) = P({BMM,MBM,MMB}) = 3/8P(X=3) = P({MMM}) = 1/8
Sebaran Binom(n,p) sebaran Binom dengan parameter n dan p(sebaran peluang diskret)
n0,1,2,..., ; )1()( =−⎟⎟⎠
⎞⎜⎜⎝
⎛== − xpp
xn
xXP xnx
Peubah Acak fungsi yang memetakan anggota gugus RC ke gugus bilangan nyata
Nilai Harapan & Ragam Peubah Acak XNilai Harapan & Ragam : Sebaran Binom(n,p)
,...,nixPxXE i
n
iix 0 ; )()(
0=== ∑
=
μ
222 )()( XEXEx −=σ
,...,nixPxXE i
n
ii 0 ; )()(
0
22 ==∑=
X 0 1 2 3P(X) 0.125 0.375 0.375 0.125
E(X) = 1.5
σ2 = 0.75
Khusus pada sebaran Binom(n,p) :
E(X) = μ = np dan σ2 = np(1-p)
Contoh: n=3 & p=0.5
Peluang Kontinu
4 0 ; 41)( ≤≤= xxf
Sebaran Seragam kontinu
P(X=3) = 0 pada sebaran kontinu, peluang pada satu titik =0
43
40
43|
441)()3(
3
0
3
0
3
=−====< ∫∫∞−
xdxdxxfXP
41
42
43|
441)()32(
3
2
3
2
3
2
=−====≤< ∫∫xdxdxxfXP
dxxxfXE x ∫∞
∞−
== )()( μNilai harapan
Peluang Normal
- ; 21),;(
2
21
2 ∞<<∞=⎟⎠⎞
⎜⎝⎛ −
−xexf
xσμ
σπσμ
Sebaran Normal
(fungsi peluang kontinu)
) ,N( ~ X 2σμ
Contoh: Berat ikan di suatu danau mengikuti pola sebaran normal dengan rataan 400g dan standard deviasi 100g. Jika diambil satu ikan secara acak, berapa peluang mendapatkan ikan yang beratnya lebih dari 500g?
)1 ,0N( ~ Z -Xσμ
=ZTabel-Z
1587.0)1(100
400500)500( =>=⎟⎠⎞
⎜⎝⎛ −
>=> ZPZPXP
Peluang Normal, Z, t, χ2, F Jika X~N(μ, σ2) ~N(μ, σ2/n)
Bagaimana jika sebaran pop tdk normal Dalil Limit Pusat
Apapun sebaran populasinya, ~N(μ, σ2/n) dengan n ∞
Jika σ2 tidak diketahui, maka sebaran Normal (Z) sebaran t
Peubah acak Z2 sebaran χ2 (Khi-kuadrat)
Rasio dari p.a. sebaran χ2 sebaran F
Penggunaan:Sebaran Z menguji μ jika σ2 diketahuiSebaran t menguji μ jika σ2 tidak diketahuiSebaran χ2 menguji ragam (σ2)Sebaran F Rasio dua ragam
x
x
Metode SamplingTujuan Utama:Mendapatkan sampel yang mencerminkan populasi
dapat digunakan untuk menduga populasi
Metode Sampling Probability vs Non Probability Sampling
Masalah utama dalam sampling:1. Menentukan metode sampling yang sesuai
2. Menentukan ukuran sampel yang mewakili populasi(dengan tingkat ketelitian yang diinginkan dan segala kendala yang ada)
Metode SamplingProbability SamplingMetode Sampling yang berbasis pada pemilihan secara acak
Acak setiap unit memiliki peluang yang sama untuk terpilih
Butuh kerangka contoh (daftar seluruh unit atau anggota populasi)
Beberapa definisi:
N = banyaknya objek dalam kerangka contoh (sampling frame)
n = banyaknya objek dalam contoh
f = n/N = fraksi contoh
Metode SamplingBeberapa Metode (Probability Sampling)• Penarikan Contoh Acak Sederhana (Simple Random Sampling)
• Penarikan Contoh Acak Berlapis (Stratified Random Sampling)
• Penarikan Contoh Sistematis (Systematic Random Sampling)
• Penarikan Contoh Gerombol (Cluster Random Sampling)
• Penarikan Contoh Bertahap (Multi-Stage Sampling)
Error Sampling Error vs Non Sampling Error
Metode SamplingUkuran contoh optimum (n)
n = f(ragam, ukuran populasi, ketelitian yang diinginkan, biaya, waktu, resiko)
Ukuran contoh yang diperlukan untuk menduga μ dengan batas error pendugaan sebesar B adalah:
Ukuran contoh yang diperlukan untuk menduga P dengan batas error pendugaan sebesar B adalah:
4B Ddengan ,
)1(
2
2
2
=+−
=σ
σDN
Nn
)1()1()1(
ppDNpNpn
−+−−
=
222
22
)1( ε−+=
NVzNVzn
222
2
)1()1()1(
pNppzpNpzn
ε−+−−
=
Z=1.96 dengan SK 95%, V=Std relatif thd mean, ε=batas kesalahan yang diinginkan (% thd mean)
Metode SamplingContoh Penentuan ukuran contoh optimum (n)
Tentukan ukuran contoh optimum untuk menduga rata-rata produksi petambak jika diketahui N=10000 dan range produksi petambak antara 10-20 ton, dan batas error yang diinginkan B=1 ton.
2594.245.2
41*)110000(
5.2*100002
2
2
≅=+−
=n
Tentukan ukuran contoh optimum untuk menduga proporsi (p) indukan udang yang baik jika diketahui N=2000 dan diinginkan batas error B=0.05. Asumsikan proporsi awal tidak diketahui.
33447.3335.*5.
405.*)12000(
5.*5.*2000)1()1(
)1(2 ≅=+−
=−+−
−=
ppDNpNpn
5.24
104
==≈rangeσ
Metode SamplingNon Probability Sampling• Pemilihan tidak dilakukan secara acak
• Generalisasi terhadap populasi agak sulit dilakukan
• Sering digunakan dalam penelitian sosial, marketing research, dll., krn Probability Sampling tidak praktis atau bahkan tidak dapat diterapkan
• Accidental/Haphazard/Convenience vs Purposive
• Purposive Model Instance Sampling, Expert Sampling, Quota Sampling, Heterogenety Sampling, Snowball Sampling
Pendugaan ParameterDugaan Titik
untuk menduga μ
s2 untuk menduga σ2
x
Dugaan SelangSelang kepercayaan (1-α)100% bagi μ
Jika σ2 diketahui:
Jika σ2 tdk diketahui:
nzx
nzx σμσ
αα22
+<<−
nstx
nstx nn )1()1( 22 −− +<<− αα μ
Dugaan SelangSelang kepercayaan (1-α)100% bagi μ1-μ2 dua contoh bebas
Jika σ1 dan σ2 tdk diketahui dan diasumsikan sama:
Pendugaan Parameter (lanjutan)
2
22
1
21
21212
22
1
21
21 22)()(
nnzxx
nnzxx σσμμσσ
αα ++−<−<+−−
⎟⎟⎠
⎞⎜⎜⎝
⎛++−<−<⎟⎟
⎠
⎞⎜⎜⎝
⎛+−−
21
2)(2121
21
2)(21
11)(11)(22 nn
stxxnn
stxx gabvgabv αα μμ
2dan 2
)1()1(21
21
222
2112 −+=
−+−+−
= nnvnn
snsnsgab
Dugaan SelangSelang kepercayaan (1-α)100% bagi μ1-μ2 dua contoh bebas
Jika σ1 dan σ2 tdk diketahui dan diasumsikan tidak sama:
Pendugaan Parameter (lanjutan)
⎟⎟⎠
⎞⎜⎜⎝
⎛++−<−<⎟⎟
⎠
⎞⎜⎜⎝
⎛+−−
2
22
1
21
)(21212
22
1
21
)(21 22)()(
ns
nstxx
ns
nstxx vv αα μμ
( ) ( )⎥⎥⎦
⎤
⎢⎢⎣
⎡−⎟
⎠⎞
⎜⎝⎛+
⎥⎥⎦
⎤
⎢⎢⎣
⎡−⎟
⎠⎞
⎜⎝⎛
⎟⎠⎞
⎜⎝⎛ +
=
11
2
2
2
22
1
2
1
21
2
2
22
1
21
nnsnn
s
ns
ns
v
Dugaan SelangBeda nilai tengah bagi contoh berpasangan: μd
Selang kepercayaan (1-α)100% bagi μd
Pendugaan Parameter (lanjutan)
nstd
nstd d
nDd
n )1()1( 22 −− +<<− αα μii
ii
d xxin
dds 21i
2
2 ddan )(
−=−
−=∑
Dugaan selang bagi proporsi: P
Ragam proporsi
Selang kepercayaan (1-α)100% bagi Pn
Ppp
)1(2 −=σ
nppzpP
nppzp )1()1(
22
−+<<
−− αα
Hipotesis Statistik: Pernyataan/dugaan mengenai parameter populasi yang ingin dibuktikan kebenarannya
H0 hipotesis nol
H1 atau Ha hipotesis satu atau hipotesis alternatif
Misalnya:
H0: μ=100 vs H1: μ=120 tunggal
H0: μ=60 vs H1: μ≠60 uji dwi arah
H0: μ=160 vs H1: μ>160 uji eka arah
H0: μ=500 vs H1: μ<500 uji eka arah
Pengujian Hipotesis
Berdasarkan data yang dikumpulkan, H1 atau H0 yang benar ?
majemuk
Pengujian Hipotesis (lanjutan)
H0 benar H1 benar
Hasil Pengujian
H0 benar Benar Salah Jenis 1 (α)
Salah Jenis 2 (β)
H1 benar
Keadaan Sebenarnya
Benar
α = Peluang menolak H0 padahal H0 benar
β = Peluang menerima H0 padahal H1 yang benar
Contoh :Suatu contoh acak berukuran 30 diambil dari populasi A. Nilai rata-rata dari 30 contoh tersebut adalah 123. Manakah yang lebih Anda percayai, ke-30 contoh tersebut berasal dari populasi A yang menyebar N(120,100) ataukah sebenarnya dari populasi B yang menyebar N(127,100)?
Peluang menyatakan H1 benar padahal H0 yang benar =
H0: μ = 120 vs H1: μ = 127
( )
0510
1.6432
3010
1201230
.
zPzP
n
xzP H
=
>=
⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛−
>=
⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛−
> σμ
Peluang menyatakan H0 benar padahal H1 yang benar =
( )
0140
-2.1909
3010
1271231
.
zPzP
n
xzP H
=
<=
⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛−
<=
⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛−
< σμ
Pengujian Hipotesis (lanjutan)
Kaidah Keputusan:
Jika p-value < α H1 benar
Jika p-value ≥ α H0 dianggap benar
α taraf nyata pengujian (kesalahan maksimum yang diperbolehkan jika memutuskan H1 benar)
P-value peluang salah jenis 1 berdasarkan data
Teladan 1:
Pada saat ini diduga terjadi kenaikan rata-rata tinggi badan orang Indonesia dibandingkan tahun 70-an. Untuk membuktikan dugaan ini diambil contoh acak berukuran 25 dan diperoleh rataan sebesar 164 cm. Ujilah apakah dugaan tersebut benar. Gunakan α=5%. (Catatan: Tinggi rata-rata tahun 70-an=161 cm, dan σ2=81 cm2).
Pengujian Hipotesis (lanjutan)
Diketahui: n=25, =164 cm ; σ2=81 cm2 ; α =5%=0.05.
H0: μ=161 cm vs H1: μ>161cm
Z tabel = Z0.05 = 1.65
P-value = P(x>x0 / μ =161) = P(Z>1.67) = 0.0475
P-value < α Tolak H0
(Memang benar sekarang ada kenaikan rata-rata tinggi orang Indonesia dibandingkan dengan tahun 70-an)
x
67.125/81
161-164 /-x
===n
Zσ
μ
Z > Ztab Tolak H0
Pengujian Hipotesis (lanjutan)
Secara Umum:
Satu Nilai Tengah Populasi: H0: μ = μ0 vs H1: μ ≠ μ0
H0: μ ≤ μ0 vs H1: μ > μ0
H0: μ ≥ μ0 vs H1: μ < μ0
Dua Nilai Tengah Populasi:
Saling Bebas Berpasangan
H0: μ1= μ2 vs H1: μ1 ≠ μ2 H0: μD = 0 vs H1: μD ≠ 0
H0: μ1 ≤ μ2 vs H1: μ1> μ2 H0: μD ≤ 0 vs H1: μD > 0
H0: μ1 ≥ μ2 vs H1: μ1< μ2 H0: μD ≥ 0 vs H1: μD < 0
Pengujian Hipotesis (lanjutan)Teladan-2:
Ada dugaan kuat bahwa latar belakang petambak berpengaruh terhadap keberhasilan sebagai petambak di CP Bahari. Untuk membuktikan pendapat ini, dipilih 22 petambak contoh secara acak, dimana 11 orang berlatar belakang petambak dan 11 orang sisanya berlatar belakang bukan petambak. Jika produksi merupakan ukuran tingkat keberhasilan petambak, dan produksi terakhir dari ke-22 petambak tersebut seperti tabel di bawah ini, ujilah apakah dugaan tersebut di atas benar? (Gunakan α=5% dan asumsikan ragam produksi kedua populasi sama).
11.7 9.6 12.2 8.6 9.3 10.1 8.9 9.5 10.4 8.3 9.4Produksi dari 11 Petambak yang Berlatar Belakang Petambak
7.4 8.5 9.2 8.7 7.8 6.9 10.2 9.4 8.1 8.3 9.0Produksi dari 11 Petambak yang Berlatar Belakang Bukan Petambak
Bentuk Hipotesis ? Statistik Uji ?
⎟⎟⎠
⎞⎜⎜⎝
⎛+
−=
−=
−
21
2
2121
11
)()(
21
nns
xxs
xxt
gabxx
hit
H0: μ1 ≤ μ2 vs H1: μ1> μ2
Data• Data adalah bentuk jamak dari datum, berasal dari bahasa Latin yang berarti
"sesuatu yang diberikan". Dalam penggunaan sehari-hari data berarti suatu pernyataan yang diterima secara apa adanya. Pernyataan ini adalah hasil pengukuran atau pengamatan suatu variabel yang bentuknya dapat berupa angka, kata-kata, atau citra.
• Data in everyday language is a synonym for information.[1] In the exact sciences there is a clear distinction between data and information, where data is a measurement that can be disorganized and when the data becomes organized it becomes information. Data may relate to reality, or to fiction as in a fictional movie. Data about reality consists of propositions. A large class of practically important propositions are measurements or observations of a variable. Such propositions may comprise numbers, words or images.