TPB#05-Simple Linear Regression
-
Upload
herni-suardi -
Category
Documents
-
view
243 -
download
5
Transcript of TPB#05-Simple Linear Regression
Teknik ProyeksiBisnis
#05. SIMPLE LINEAR REGRESSION
PROGRAM STUDI MANAJEMENFAKULTAS EKONOMIUNIVERSITAS NEGERI PADANG GESIT THABRANI
Outline
Associative Forecasting1
AnalisisAnalisis RegresiRegresi LinierLinier2
KesalahanKesalahan StandarStandar daridari
Met
ode
Pro
yeks
iSed
erha
na
KesalahanKesalahan StandarStandar daridariSuatuSuatu EstimasiEstimasi3
Koefisien Korelasi4
Koefisien Determinasi5
Associative ForecastingAssociative Forecasting
� Peramalan asosiatif biasanyamempertimbangkan beberapa variabelyang berhubungan dengan kuantitasyang diprediksi
� Saat variabel ini terkait ini ditentukan, � Saat variabel ini terkait ini ditentukan, model statistik digunakan untukmeramalkan
� Pendekatan ini lebih berdaya gunadaripada metode time series yang hanya menggunakan nilai historisvariabel yang diramalkan
Associative ForecastingAssociative Forecasting
� Banyak faktor yang dapat dipertimbangkandalam analisis asosiatif
� Contoh, penjualan PC IBM mungkin terkaitdengan anggaran iklan IBM, harga yang diberikan perusahaan, harga pesaing, strategi promosi, bahkan kondisistrategi promosi, bahkan kondisiperekonomian negara dan tingkatpengangguran
� Dari contoh, penjualan PC disebut sebagaivariabel terikat (dependent variable) danvariabel lain disebut variabel bebas(independent variable)
Peramalan asosiatif digunakan ketikaperubahan pada satu atau lebih variabel
bebas dapat digunakan untuk meramalkanperubahan pada variabel terikat
AnalisisAnalisis RegresiRegresi LinierLinier
Teknik yang umum digunakan adalahlinear regression analysis
AplikasiAplikasi teknikteknik iniini samasama sepertiseperti padapada time time seriesseries
� Model matematis yang sama dengan metode
kuadrat terkecil dari proyeksi tren untuk
melakukan analisis regresi
� Variabel terikat yang ingin diramalkan tetap y,
dimana variabel bebas (x) bukan lagi waktu
AnalisisAnalisis RegresiRegresi LinierLinier
y y = = a a + + bxbx^̂
dimana y = nilai variabel terikat yang diprediksi(dependent variable)
a = perpotongan sumbu yb = kemiringan (slope) garis regresix = variabel bebas yang digunakan untuk
memprediksi variabel terikat
^
Variabely DeviationDeviation55
DeviationDeviation77
DeviationDeviation66
Actual observation Actual observation (y value)(y value)
Metode Least squares
AnalisisAnalisis RegresiRegresi LinierLinier
VariabelVariabel xx
Variabel
DeviationDeviation11
DeviationDeviation22
DeviationDeviation44
DeviationDeviation33
Trend line, y = a + bxTrend line, y = a + bx^̂
Metode Least squares meminimalisir jumlahkuadrat error (deviasi)
Persamaan-persamaan untuk menghitung variabel regresi
ΣΣxyxy -- nxynxy
y y = = a a + + bxbx^̂
AnalisisAnalisis RegresiRegresi LinierLinier
b =b =ΣΣxyxy -- nxynxy
ΣΣxx22 -- nxnx22
a = y a = y -- bxbx
Sales Upah(juta $), y milyar $), x
2.0 13.0 32.5 42.0 22.0 1 4.0 –
Contoh 1
2.0 13.5 7
3.0 –
2.0 –
1.0 –
| | | | | | |0 1 2 3 4 5 6 7
Sale
s
Upah
Sales, y Upah, x x2 xy
2.0 1 1 2.03.0 3 9 9.02.5 4 16 10.02.0 2 4 4.02.0 1 1 2.03.5 7 49 24.5
Contoh 1
3.5 7 49 24.5
∑y = 15.0 ∑x = 18 ∑x2 = 80 ∑xy = 51.5
xx = = ∑∑xx/6 = 18/6 = 3/6 = 18/6 = 3
yy = = ∑∑yy/6 = 15/6 = 2.5/6 = 15/6 = 2.5
bb = = = .25= = = .25∑∑xy xy -- nxynxy
∑∑xx22 -- nxnx22
51.5 51.5 -- (6)(3)(2.5)(6)(3)(2.5)
80 80 -- (6)(3(6)(322))
aa = = yy -- bbx = 2.5 x = 2.5 -- (.25)(3) = 1.75(.25)(3) = 1.75
4.0 –
y = 1.75 + .25x^̂
Sales = 1.75 + 0.25(upah)
Contoh 1
4.0 –
3.0 –
2.0 –
1.0 –
| | | | | | |0 1 2 3 4 5 6 7
Sale
s
upah
Jika upah tahundepan diperkirakan6 milyar $, maka:
Sales = 1.75 + .25(6)Sales = $3,250,000
3.25
Contoh 1
♦ a = intercept, adalah nilai Y jika X sama dengan nol.
♦ Maknanya, rata-rata penjualanakan 1.75 juta dolar jika upahsama dengan nol
♦ b = slope, adalah perubahan Y rata-rata jika X naik sebesar1 unit satuan
♦ Maknanya, Y akan naik sebesar0.25 juta dolar jika x naik sebesar1 milyar dolar
� Dari contoh kasus, terlihat kelemahan dari
metode peramalan asosiatif seperti regresi
� Saat telah dihitung sebuah persamaan
regresi, kita harus meramalkan variabel
bebas, x, - dalam hal ini adalah upah –bebas, x, - dalam hal ini adalah upah –
sebelum memperkirakan variabel terikat y
untuk periode yang akan datang
� Departemen olah raga sebuah Universitas negeri
ingin meningkatkan budget tim untuk tahun
depan dengan menggunakan ramalan jumlah
penonton pertandingan football, karena jumlah
penonton akan sangat mempengaruhi
Contoh 2
penonton akan sangat mempengaruhi
pemasukan tim
� Direktur percaya bahwa jumlah penonton sangat
terkait dengan jumlah kemenangan yang
diperoleh tim
� Manajer bisnis telah membuat akumulasi jumlah
penonton tahunan untuk 8 tahun terakhir
Contoh 2
Menang Penonton Menang Penonton
4 36.300 6 44.000
6 40.100 7 45.600
6 41.200 5 39.000
8 53.000 7 47.5008 53.000 7 47.500
� Dengan memperhatikan kemampuan dan
perkembangan tim, direktur yakin bahwa tim
paling sedikit akan memenangkan 7 pertandingan
tahun depan
� Gunakan simple regression untuk meramalkan
jumlah penonton tahun depan?
� Peramalan hanyalah sebuah titik estimasiuntuk nilai yang akan datang
� Titik ini sebenarnya adalah rata-rata dari sebuahdistribusiprobabilitas
4.0 –
KesalahanKesalahan StandarStandar daridari SuatuSuatuEstimasiEstimasi
probabilitas4.0 –
3.0 –
2.0 –
1.0 –
| | | | | | |0 1 2 3 4 5 6 7
Sale
s
upah
3.25
� Peramalan sebesar $325.000 disebut titik prediksi y
� Titik prediksi adalah rata-rata atau nilai harapan(expected value) dari suatu distribusi nilai penjualanyang mungkin
4.0 –
KesalahanKesalahan StandarStandar daridari SuatuSuatuEstimasiEstimasi
3.0 –
2.0 –
1.0 –
| | | | | | |0 1 2 3 4 5 6 7
Sale
s
upah
3.25
� Untuk menghitung keakuratan regresi yang
diperkirakan, kita harus menghitung
kesalahan standar estimasi (standard error
of the estimate), Sy,x
� Perhitungan ini disebut deviasi standar
KesalahanKesalahan StandarStandar daridari SuatuSuatuEstimasiEstimasi
� Perhitungan ini disebut deviasi standar
regresi (standard deviation of the
regression), yang menghitung kesalahan
dari variabel terikat, y, terhadap garis
regresi, dan bukan terhadap rata-rata
SSy,xy,x ==∑∑((y y -- yycc))
22
n n -- 22
KesalahanKesalahan StandarStandar daridari SuatuSuatuEstimasiEstimasi
dimana y = nilai y untuk setiap titik data
yc = nilai terhitung variabel terikat, daripersamaan regresi
n = jumlah data
Untuk mempermudah perhitungan,
persamaan tadi diturunkan menjadi
persamaan berikut:
KesalahanKesalahan StandarStandar daridari SuatuSuatuEstimasiEstimasi
Standard error digunakan untuk
menyiapkan interval yang diprediksi di
sekitar titik prediksi
SSy,xy,x ==∑∑yy22 -- aa∑∑yy -- bb∑∑xyxy
n n -- 22
4.0 –
SSy,xy,x = == =∑∑yy22 -- aa∑∑y y -- bb∑∑xyxy
n n -- 22
39.5 39.5 -- 1.75(15) 1.75(15) -- .25(51.5).25(51.5)
6 6 -- 22
SSy,xy,x = = 00.306.306
KesalahanKesalahan StandarStandar daridari SuatuSuatuEstimasiEstimasi
Dari contoh 1
4.0 –
3.0 –
2.0 –
1.0 –
| | | | | | |0 1 2 3 4 5 6 7
Sale
s
upah
3.25
MakaMaka kesalahankesalahanstandarstandar estimasiestimasiadalahadalah $306,000$306,000dalamdalam penjualanpenjualan
� Kesalahan baku estimasi mengukur jarak bakuantara sebuah titik data dengan garis regresidari sampel
� Analisis regresi yang mempunyai nilai kesalahanbaku estimasi yang kecil menunjukkan bahwapancaran titik-titik data pada scatter diagram
KesalahanKesalahan StandarStandar daridari SuatuSuatuEstimasiEstimasi
pancaran titik-titik data pada scatter diagram sangat berdekatan dengan garis regresi sampeltersebut, yang berarti pula memiliki kesesuaianterbaik, dan sebaliknya
� Selain itu, dapat digunakan untukmembandingkan nilai penyebaran titik-titik data di sekitar garis regresi yang satu dengan garisregresi yang lain
� Garis regresi yang dihitung adalah garis regresi
sampel karena hanya dihitung berdasarkan suatu
sampel random
� Karena itu untuk membuat suatu interval prediksi
Y, kita harus perhatikan baik penyebaran titik
KesalahanKesalahan StandarStandar daridariPeramalanPeramalan
Y, kita harus perhatikan baik penyebaran titik
sampel di sekitar garis rgresi sampel maupun di
sekitar garis regresi populasi sebenarnya
� Kesalahan standar peramalan (standar error of
the forecast) mengukur nilai Y yang diperkirakan
di sekitar nilai Y yang sebenarnya, untuk nilai X
tertentu
♦ Kesalahan standar peramalan
memperhitungkan kedua nilai
penyebaran
♦ Rumusnya:
KesalahanKesalahan StandarStandar daridari SuatuSuatuPeramalanPeramalan
( ) ))(1
1( 2
2
,
∑ −−++=
XX
XX
nSS xyf
� Persamaan regresi adalah suatu cara untukmenyatakan hubungan antar variabel
� Garis regresi bukanlah sebab akibat, namun menjelaskan hubungan antar-variabel
� Persamaan regresi menunjukkan
Koefisien Korelasi
� Persamaan regresi menunjukkanbagaimana suatu variabel berhubunganpada nilai dan perubahan pada variabel lain
� Cara lain untuk mengevaluasi hubunganantara dua variabel adalah denganmenghitung koefisien korelasi (coefficient of correlation)
Koefisien Korelasi
� Koefisien korelasi merupakan suatu ukuran
yang menunjukkan kekuatan hubungan
antara dua variabel
� Ukuran ini menyatakan derajat atau
kekuatan hubungan linierkekuatan hubungan linier
� Biasanya diidentifikasi sebagai r
� Koefisien korelasi adalah suatu bilangan
antara +1 dan -1
y
x(a)Korelasi positifsempurna: r = +1
y
x(b)Korelasipositif: 0 < r < 1
y
x(c) Tidak adakorelasi: r = 0
y
x(d)Korelasi negatifsempurna: r = -1
r = r = nnΣΣxyxy -- ΣΣxxΣΣyy
[[nnΣΣxx22 -- ((ΣΣxx))22][][nnΣΣyy22 -- ((ΣΣyy))22]]
Koefisien Korelasi
� Walaupun kofisien korelasi merupakanperhitungan yang sering digunakan, namun ada perhitungan yang lain untukmenjelaskan hubungan antara dua variabel
� Perhitungannya disebut koefisiendeterminasi (coefficient of determination)
Koefisien Determinasi
determinasi (coefficient of determination) dan merupakan pengkuadratan sederhanakoefisien korelasi , r2,
� Mengukur persentase perubahan padaprediksi y dengan adanya perubahan x
� Nilainya antara 0 sampai 1
� Untuk contoh 1, maka:
r = 0.901
r2 = 0.81
Korelasi dan determinasi
� Hal ini mengindikasikan bahwa81% dari variasi total dijelaskanoleh persamaan regresi
Interpretasi dari nilai tersebut:
� 81% dari variabilitas penjualandapat dijelaskan oleh variabilitasupah
� Variabilitas yang tidak dapat
Koefisien Determinasi
� Variabilitas yang tidak dapatdijelaskan oleh upah adalahsebesar 29%
� Variabilitas yang tidak daptdijelaskan ini mungkin dapatdijelaskan oleh faktor-faktor lain
� Keunggulan koefisien korelasi ( r ) adalahbahwa koefisien ini dapat menunjukkandua macam hubungan: positif dan negatif
� Keunggulan koefisien determinasi (r2) adalahkoefisien ini mengandung interpretasi yang sangat berguna, karena koefisien ini
Korelasi dan Determinasi
sangat berguna, karena koefisien inimengukur persentase variabel Y yang dijelaskan oleh variabel X
� Interpretasi ini merupakan interpretasi yang paling berguna sehingga r2 menjadi salah satudari angka statistik yang paling seringdibicarakan dalam analisis regresi
Contoh 3
Tahun
JumlahWisatawan
(dlmjutaan)
Penumpang bis dan kereta
bawah tanah Tahun
Jumlah wisatawan
(dlm jutaan)
Penumpangbis dankeretabawah
tanah (dlm
Jumlah penumpang bis dan kereta dipercayaberkaitan erat dengan jumlah wisatawan
jutaan)bawah tanah (dlm jutaan)
jutaan) tanah (dlmjutaan)
1 7 1.5 7 16 2.4
2 2 1 8 12 2
3 6 1.3 9 14 2.7
4 4 1.5 10 20 4.4
5 14 2.5 11 15 3.4
6 15 2.7 12 7 1.7
Contoh 3
�Gambarkan data pada sebuah grafik danputuskan bahwa model linear baik untukdigunakan!
�Bentuklah hubungan regresi!
�Apakah yang diharapkan oleh parapenumpang jika ada 10 juta wisatawanpenumpang jika ada 10 juta wisatawanmengunjungi kota tiap tahun?
�Jelaskan jumlah penumpang yang diprediksijika ternyata tidak ada wisatawan samasekali!
�Berapa prediksi kesalahan standar
�Berapakah koefisien korelasi dan determinasimodel ini
Contoh 4
13 mahasiswa mengambil konsentrasi MO.
Setelah 2 tahun, dibandingkan nilai
SATmereka sebelum masuk MO dengan IPK
mereka sekarang, seperti pada tabel berikut:
Mahasiswa A B C D E F G
Nilai SAT 421 377 585 690 608 390 415
IPK 2,90 2,93 3,00 3,45 3,66 2,88 2,15
Mahasiswa H I J K L M
Nilai SAT 481 729 501 613 709 366
IPK 2,53 3,22 1,99 2,75 3,9 1,6
Contoh 4
�Apakah ada hubungan yang berartiantara nilai TPA dengan IPK?
�Jika nilai TPA seorang mahasiswa 350, berapa menurut anda nilai IPK-nya?
�Bagaimana dengan mahasiswa yang �Bagaimana dengan mahasiswa yang memiliki nilai TPA 800?
Contoh 5
Pimpinan sebuah perusahaan jasa teknik
berpikir jasa mereka yang dikontrak oleh
perusahaan konstruksi sangat terkait dengan
jumlah bisnis konstruksi jalan yang dikontrak
perusahaan konstruksi tersebut
Kuartal 1 2 3 4 5 6 7 8
Sales 8 10 15 9 12 13 12 16
Kontrak 153 172 197 178 185 199 205 225
Contoh 5
a) Dengan menggunakan data tersebut,
buatlah persamaan regresi untuk
memprediksi tingkat permintaan jasa
teknik
b) Tentukan koefisien korelasi dan prediksib) Tentukan koefisien korelasi dan prediksi
kesalahan standar!
Contoh 6
Mr Bump mengamati harga jual dan jumlah
penjualan susu dari 10 data random.
Week Sales Price Week Sales PriceWeek Sales Price Week Sales Price
1 10 1.3 6 15 1.2
2 6 2 7 5 1.6
3 5 1.7 8 12 1.4
4 12 1.5 9 17 1.00
5 10 1.6 10 20 1.1
Contoh 6
1) Apakah ada hubungan antara harga jual
dengan penjualan susu?
2) Bagaimana hubungannya?
3) Tentukan persamaan regresinya!
4) Hitung standar error-nya!4) Hitung standar error-nya!
5) Ramalkan penjualan jika harga jual
ditetapkan sebesar $1.6!
Residual
�Jika menggunakan nilai rata-rata Y sebagai penaksir maka setiap penaksiranyang dibuat muncul beberapa variabelkesalahan
�Kesalahan-kesalahan ini disebut residual
�Jumlah residual selalu nol
�Jumlah kuadrat residual (sum of the squared residuals = SSR) merupakanvariabilitas total nilai Y dari nilai rata-rata (mean)-nya
∑ −= 2)( YYSSR
Residual
�Jumlah kuadrat residual dapat diubahmenjadi varians dapat diubah denganmembaginya dengan derajat kebebasan
�Jadi, varians total dari Y terhadap nilairata-ratanya adalah:
1
)( 22
−−
= ∑n
YYS y
Residual
�Jika menggunakan persamaan regresiyang telah diestimasi untuk meramalkanY, maka garis regresi tersebut akanmenghasilkan taksiran Y yang lebihakurat daripada jika menggunakan y rata-ratarata-rata
�Akan tetapi, residual tetap ada namunlebih kecil
�Maka SSR nya adalah:
∑ − 2)ˆ( YY
Residual
�Varians Y terhadap nilai taksiran adalah:
1
)ˆ( 22
−−
= ∑n
YYS y 1−n
Residual
�Hubungan antara penyimpangan total dengan penyimpangan yang terjelaskandengan penyimpangan yang tidakterjelaskan adalah sebagai berikut:
�Penyimpangan total (SST) = penyimpangan yang terjelaskan (SSR) + penyimpangan yang tidak terjelaskan(SST)
∑∑∑ −+−=− 222 )ˆ()ˆ()( YYYYYY
Residual
�Penyimpangan residual ini digambarkandalam tabel analysis of varians (ANOVA Tabel)
�Di dalam ANOVA tabel juga ada MSR (Mean square regression) dan MSE (mean square error) yang diperoleh dari(mean square error) yang diperoleh daripembagian SSR dengan df nya dan SSE dengan dfnya
∑∑∑ −+−=− 222 )ˆ()ˆ()( YYYYYY
Uji Hipotesis
�Koefisien korelasi sample (r) memilikipasangan dalam populasinya yaitukoefisien korelasi populasi yaitu Γ (rho) dan koefisien determinasi dari populasiadalah Γ2
Informasi sampel digunakan untuk�Informasi sampel digunakan untukmenarik kesimpulan tentang hubunganX-Y diantara seluruh data populasi
�Uji statistik yang bisa digunakan adalahuji hipotesis
H0 : β = 0
Uji Hipotesis
�β adalah kemiringan (slope) dari garispopulasi sebenarnya
�Jika hipotesis nol ini ditolak berartibahwa sampel mempunyai nila b yang tidak sama dengan nol
�Namun bukti tersebut belum cukup kuatuntuk menolak anggapan bahwa dalamseluruh populasi data garis regresinyaadalah mendatar (horizontal) atau Γ = 0
�Dapat terjadi Β =0 sedangkan b tidaksama dengan 0
Uji Hipotesis
xyb
XX
SS
H β
−=
=
∑2
,
0
)(
0:
bS
bt
XX
β−=
−∑ )(
Nilai t dibandingkan dengan nilai t tabel
Jika |t |> t tabel maka Ho ditolak
Uji Hipotesis
Keadaan khusus:
�Keadaan 1
� n= 1000, r2 = 0,10
� Hipotesis H0 : β = 0 ditolak
� Namun analisis regresi dianggap tidak� Namun analisis regresi dianggap tidakberguna
�Keadaan 2
� n =3 , r2 = 0,95
� Hipotesis H0 : β = 0 tidak dapat kitatolak
Uji Hipotesis
Uji rasio varians atau F statistik
�Untuk menguji apakah suatu model merupakan model yang baik, kita dapatmengujinya dengan membagi estimasiyang tidak bias dari varians yang dijelaskan oleh model dengan variansdijelaskan oleh model dengan varianskesalahan model
� F = regression mean square / error mean square
�F = MSR / MSE
�Nilai F ini dibandingkan dengan nilai Ftabel
Uji Hipotesis
Nilai F dibandingkan dengan nilai F padatabel F :
�Jika nilai F hitung > F tabel maka H0
ditolak