STATISTIKA INDUSTRI 2 -...
Transcript of STATISTIKA INDUSTRI 2 -...
08/11/2013
1
STATISTIKA INDUSTRI 2
TIN 4004
Pertemuan 8
• Outline: – Regresi Linier Sederhana dan Korelasi (Simple
Linier Regression and Correlation)
• Referensi: – Montgomery, D.C., Runger, G.C., Applied Statistic
and Probability for Engineers, 5th Ed. John Wiley & Sons, Inc., 2011.
– Walpole, R.E., Myers, R.H., Myers, S.L., Ye, K., Probability & Statistics for Engineers & Scientists , 9th Ed. Prentice Hall, 2012.
Introduction to Linier Regression
• Dasar:
– studi mengenai hubungan dua atau lebih variabel
– Deterministik linier:
• Single variable: 𝒀 = 𝜷𝟎 + 𝜷𝟏𝒙
• Multiple variable: 𝒀 = 𝜷𝟎 + 𝜷𝟏𝒙𝟏 + 𝜷𝟐𝒙𝟐
• 𝑌 : Dependent Variable / responses
• 𝑥 : Independent Variable / regressors
• 𝛽0 = 𝑖𝑛𝑡𝑒𝑟𝑐𝑒𝑝𝑡
• 𝛽1 = 𝑠𝑙𝑜𝑝𝑒
Introduction to Linier Regression
Introduction to Linier Regression
• Kondisi nyata: sangat jarang terjadi deterministik linier – Contoh:
• Konsumsi energi rumah tangga, dipengaruhi oleh ukuran rumah
• Pemakaian BBM, dipengaruhi berat muatan
• ANALISA REGRESI: – Pertama kali digunakan oleh Sir Francis Galton, untuk studi
keterkaitan tinggi seorang ayah dan anak laki-laki-nya.
– Tool statistik yang digunakan untuk memodelkan dan mengeksplorasi hubungan antara variabel yang nondeterministik
– Digunakan untuk melakukan peramalan / prediksi, optimasi
Simple Linear Regression (SLR) Model
08/11/2013
2
Simple Linear Regression (SLR) Model
ϵ : random error; dengan mean = 0, 𝜎2 tidak diketahui
n : jumlah observasi
Simple Linear Regression (SLR) Model
• Karl Gauss: mengusulkan cara estimasi 𝛽0 dan 𝛽1, sehingga meminimasi sum of square deviasi vertikal
• Estimasi 𝛽0 dan 𝛽1 pada SLR:
Simple Linear Regression (SLR) Model
Simple Linear Regression (SLR) Model
• Variansi (σ2) titik observasi: variasi error pada persamaan regresi linier
• σ2 diestimasikan dengan s2
Contoh Soal
• Berdasarkan data tabel di atas (pengaruh hydrocarbon terhadap purity / kemurnian udara):
Contoh Soal
Hitung s2 nya!
08/11/2013
3
Latihan Soal • Estimasikan persamaan garis regresi untuk data pada tabel di
bawah ini (hitung pula estimasi variansi errornya).
Latihan Soal • Misalnya X adalah persentase kenaikan biaya periklanan dan Y
adalah persentase kenaikan hasil penjualan. Berapakah besarnya ramalan persentase kenaikan penjualan jika biaya iklan dinaikkan menjadi 15%? Tentukan variansi (kesalahan baku) regresi linier yang terbentuk.
X (%) Y (%)
1 2
2 4
4 5
5 7
7 8
9 10
10 12
Uji Hipotesa pada SLR
• Menggunakan Uji-t
• Dilakukan untuk menduga nilai parameter model regresi dan membentuk confidence intervals
• Asumsi ϵ berdistribusi normal
• Pengujian yang dilakukan:
𝐻0: 𝛽0 = 𝛽00
𝐻1: 𝛽0 ≠ 𝛽00
𝛽00 : konstanta
𝐻0: 𝛽1 = 0
𝐻1: 𝛽1 ≠ 0
𝐻0: 𝛽1 = 𝛽10
𝐻1:𝛽1 ≠ 𝛽10 𝐻1: 𝛽1 > 𝛽10 𝐻1: 𝛽1 < 𝛽10
𝛽10 : konstanta
𝑠2
• T hitung:
• Daerah penolakan:
Uji Hipotesa pada SLR
Degree of freedom = n – 2
𝐻0: 𝛽1 = 𝛽10 𝐻1: 𝛽1 ≠ 𝛽10 𝐻1: 𝛽1 > 𝛽10 𝐻1: 𝛽1 < 𝛽10
vs
𝑡0 > 𝑡α,𝑛−2 𝑡0 < −𝑡α,𝑛−2
• T hitung:
• Daerah penolakan:
Uji Hipotesa pada SLR
𝐻0: 𝛽1 = 0 𝐻1: 𝛽1 ≠ 0 vs
𝑇0 =𝛽 1
𝑠2 𝑆𝑥𝑥
Degree of freedom = n – 2
• T hitung:
• Daerah penolakan:
Uji Hipotesa pada SLR
𝐻0: 𝛽0 = 𝛽00 𝐻1: 𝛽0 ≠ 𝛽00 𝐻1: 𝛽0 > 𝛽00 𝐻1: 𝛽0 < 𝛽00
vs
Degree of freedom = n – 2
𝑡0 > 𝑡α,𝑛−2 𝑡0 < −𝑡α,𝑛−2
𝑇0 =𝛽 0 − 𝛽00
𝑠2 𝑥𝑖2 (𝑛𝑆𝑥𝑥 )𝑛
1
08/11/2013
4
Uji Hipotesa pada SLR
• Jika 𝐻0 diterima, artinya tidak ada hubungan linier antara x dan Y.
• Jika 𝐻0 diterima, artinya x sedikit mempengaruhi variasi nilai Y, dengan estimator terbaik untuk Y oleh setiap nilai x adalah 𝑦 = 𝑌. (gambar a)
• Jika 𝐻0 diterima, memang benar antara x dan Y tidak ada hubungan linier. (gambar b)
𝐻0: 𝛽1 = 0 𝐻1: 𝛽1 ≠ 0 vs
Uji Hipotesa pada SLR
• Jika 𝐻0 ditolak, artinya x memilik pengaruh pada variabilitas nilia Y.
• Jika 𝐻0 ditolak, artinya terdapat cukup hubungan linier antara x dan Y . (gambar a)
• Jika 𝐻0 ditolak, artinya terdapat hubungan linier antara x dan Y, namun lebih tepat digambarkan dengan hubungan polynomial yang lain (gambar b).
𝐻0: 𝛽1 = 0 𝐻1: 𝛽1 ≠ 0 vs
• Lakukan uji hipotesa pada parameter slope tidak sama dengan nol untuk model regresi linier pengaruh hydrocarbon terhadap purity / kemurnian udara di atas (diketahui 𝛼 = 0,01).
Uji Hipotesa pada SLR: Latihan Soal
Pendugaan Interval Koefisien Regresi (Slope & Intercept)
Contoh Soal • Berdasarkan data tabel pengaruh hydrocarbon terhadap
purity / kemurnian udara, carilah dugaan interval slope-nya:
– Jika menggunakan confidence interval (tingkat kepercayaan) 95%, maka:
𝜎 2 = 𝑠2 =
(𝑦𝑖 − 𝑦 )2−𝛽 1𝑛𝑖=1 𝑆𝑥𝑦
𝑛 − 2= 1,18
Latihan Soal Confidence Interval
• Tentukan interval dari parameter intercept dan slope pada biaya periklanan dan kenaikan penjualan berikut, dengan α = 5% atau tingkat keyakinan 95% dan jelaskan artinya!
X (%) Y (%)
1 2
2 4
4 5
5 7
7 8
9 10
10 12
08/11/2013
5
Peramalan (Prediction) Terhadap Rata-rata Respon (Y) • Berdasarkan data tabel pengaruh hydrocarbon terhadap
purity / kemurnian udara, carilah interval prediksi untuk Y, dengan 𝑥0 = 1,00%
– Sebelumnya telah diperoleh persamaan regresi
– Sehingga = 89,23
– Interval prediksi Y:
Contoh Soal
Peramalan (Prediction) terhadap Single Respon (Y)
To reflect error of precdict future observed response
• Berdasarkan data tabel pengaruh hydrocarbon terhadap purity / kemurnian udara, carilah interval prediksi untuk Y, dengan 𝑥0 = 1,00%
– Sebelumnya telah diperoleh persamaan regresi
– Sehingga 𝑦0 = 89,23
– Interval prediksi Y:
Contoh Soal
Latihan Soal Prediction
Dengan menggunakan data dari tabel biaya iklan dan kenaikan penjualan (di atas),
Buatlah:
a. Ramalan interval untuk individu Y, jika biaya iklan dinaikkan menjadi 15% dengan tingkat keyakinan 99%!
b. Ramalan interval untuk rata-rata E(Y), jika biaya iklan dinaikkan menjadi 15% dengan tingkat keyakinan 99%!
Correlation
• Analisa korelasi: – Menggambarkan hubungan antara variable 𝑋 dan 𝑌
• Jika nilai 𝑋 besar maka nilai 𝑌 besar, dan sebaliknya. Contoh: 𝑋 = fasilitas belajar, 𝑌 = prestasi siswa.
• Jika nilai 𝑋 besar maka nilai 𝑌 kecil, dan sebaliknya. Contoh: 𝑋 = usia pakai mobil, 𝑌 = nilai jual mobil.
– Note: • Korelasi tidak secara otomatis menunjukkan adanya hubungan
kausalitas / sebab akibat atau timbal balik • Contoh:
– tinggi badan menyebabkan berat badanya bertambah, tetapi berat badannya bertambah belum tentu menyebabkan tinggi badannya bertambah.
– kemiskinan dengan kebodohan – kebersihan dengan kesehatan
08/11/2013
6
Scatter Diagram of Correlation
31
• Analisa korelasi: – Population coefficient correlation = ρ
– Menggunakan sample coefficient correlation
– Disebut juga Pearson product-moment correlation coefficient.
– 𝑟 bernilai antara -1 dan +1.
– Hati-hati dalam mengintrepertasikan nilai 𝑟. Nilai 𝑟 = 0.3 dan 𝑟 = 0.6, bukan berarti hubungan X dan Y kedua 2x lipat X dan Y pertama.
Correlation
Correlation
– Sample coefficient of determination
– Menunjukkan proporsi total variasi pada nilai variabel Y yang dapat digambarkan secara linier oleh variabel X • Nilai korelasi 0.6, berarti terdapat 36% variasi nilai Y
dalam sample yang dipengaruhi secara linier oleh nilai X
Latihan Soal
• Hitung koefisien korelasi-nya dan intrepertasikan.
Pertemuan 9 - Persiapan
• Materi
–Regresi linier berganda dan korelasi
–Regresi nonlinier