Pemodelan Input
description
Transcript of Pemodelan Input
1
Pemodelan Input
Catatan diambil dari “Discrete-event System Simulation” by Banks, Carson, Nelson, and Nicol, Prentice Hall, 2005, and
“Simulation Modeling and Analysis” by Law and Kelton, McGraw Hill, 2000.
2
Outline Kualitas output bergantung pada model
input yang mengendalikan simulasi Modul ini membahas:
Pengambilan data dari sistem riil Hipotesis distribusi probabilitas Pemilihan parameter untuk distribusi Goodness of fit test – seberapa baik distribusi
memodelkan data yang tersedia Pemilihan distribusi jika tidak ada data Model proses kedatangan (Proses Poisson,
Proses Poisson Non-stasioner, Batch Arrival)
3
Pengambilan Data Buat rencana terlebih dahulu: mulai dengan sesi
latihan atau pra-observasi, perhatikan kejadian yang tidak biasa.
Analisis data pada saat dikumpulkan: cek kecukupannya.
Kombinasikan set data homogen, misalnya periode waktu yang berturut-turut, selama periode waktu yang sama pada hari yang berurutan.
Berhati-hatilah dalam melakukan sensor data: kuantitas tidak diobservasi secara total, menghabiskan waktu proses yang lama.
Periksa hubungan antar variabel, misalnya, buat diagram penyebaran.
Cek otokorelasi Kumpulkan data input, bukan data kinerja.
4
Identifikasi Distribusi Probabilitas Beberapa teknik yang dapat digunakan (bisa
digabungkan) Pengetahuan awal mengenai peran variabel
random.• Waktu antar kedatangan berdistribusi eksponensial jika
kedatangan terjadi satu per satu, memiliki mean rate konstan, dan independen.
• Waktu pelayanan tidak terdistribusi normal karena waktu pelayanan tidak boleh negatif.
• Produk banyak bagian yang independen bisa bersifat Lognormal
Gunakan dasar fisik distribusi sebagai panduan Statistik rangkuman Histogram
5
Panduan Distribusi
Gunakan dasar fisik distribusi sebagai panduan, sebagai contoh: Binomial: # sukses dalam n percobaan. Poisson: # independent event yang terjadi dalam waktu
atau ruang tertentu. Normal: distribusi proses yang merupakan jumlah
komponen-komponen proses. Eksponensial: waktu antara independent event, atau
waktu proses yang tidak memakai memory. Weibull: waktu sampai kegagalan komponen. Uniform diskrit atau kontinu: memodelkan ketidakpastian
yang lengkap. Triangular: proses yang hanya nilai minimum, dan
kemungkinan besar, nilai maksimum yang diketahui. Empiris: sampel ulang dari data aktual yang
dikumpulkan.
6
Statistik Rangkuman
LK00in 6.5 Table See
geometricor binomial negative candidate :1
Poisson candidate :1
binomial candidate:1
);(X /)(by / ratio lexis estimate ons,distributi discreteFor
1parameter shape with or Weibull gamma are candidates :1cv
lexponentia candidate :1 cv
1parameter shape with or Weibull gamma are candidates :1 cv
);(X /)(by / estimate ons,distributi continuousFor
close aremedian sample and )(X ifon distributi Symmetric
)(X :mean Sample
22
^
nnS
nnScvcv
n
n
7
Histogram Distribusi frekuensi atau histogram berguna
untuk menentukan bentuk distribusi Jumlah interval kelas bergantung pada:
Jumlah observasi Penyebaran data Disarankan: akar kuadrat ukuran sampel
Untuk data kontinu: Berhubungan dengan fungsi densitas probabilitas dari
distribusi teoritis. Untuk data diskrit:
Berhubungan dengan fungsi massa probabilitas. Jika hanya tersedia beberapa titik data:
gabungkan sel yang bersisian untuk menghaluskan bentuk histogram.
8
Histogram
0
0.05
0.1
0.15
0.2
0.1 0.6 1.1 1.6 2.1 2.6
Bin
Fre
qu
ency
Histogram untuk Data Kontinu Ambil n = 100 sample
waktu antar kedatangan request kepada Web server dalam periode 1-minute period (lihat Web page) Kedatangan request kurang
lebih stasioner – # request yang datang dalam periode 10-detik kurang lebih sama.
Sample mean = 0.534 detik; median = 0.398; CV = 0.98
Distribusi eksponensial? Sisi kanan menunjukkan dua
histogram: gambar atas dengan interval atau ukuran bin 0.1 detik; gambar bawah dengan ukuran bin 0.25 detik.
Histogram
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.25 0.75 1.25 1.75 2.25 2.75
Bin
Fre
qu
ency
9
Histogram
0
0.04
0.08
0.12
0.16
0.2
0 1 2 3 4 5 6 7 8 9 10
x
h(x
)
Histogram untuk Data Diskrit Sampel n = 100 observasi jumlah barang yang
diminta dari sebuah job shop per minggu untuk periode waktu yang lama (# permintaan, # observasi): {(0,1), (1,3), (2,8), (3,14),
(4, 18), (5,17), (6,16), (7,10), (8,8), (9,4), (10, 1)} Mean = 4.94, varians = 4.4, Lexis ratio = 0.9 Distribusi Poisson?
10
Estimasi Parameter
Tahap berikutnya setelah pemilihan sekelompok distribusi Jika observasi pada sample dengan ukuran n adalah X1, X2, …,
Xn (diskrit atau kontinu), mean dan varians sampel adalah:
Jika data diskrit dan dikelompokkan pada distribusi frekuensi:
dengan fj adalah frekuensi yang terobservasi dari nilai Xj
1 1
2221
n
XnXS
n
XX
n
i i
n
i i
1 1
22
21
n
XnXfS
n
XfX
n
j jj
n
j jj
11
Estimasi Parameter
Jika data mentah tidak tersedia (data dikelompokkan dalam interval kelas), aproksimasi mean dan varians sampel adalah:
di mana fj frekuensi yang terobservasi pada interval kelas ke-j
mj adalah titik tengah interval ke-j, dan c adalah jumlah interval kelas
Parameter adalah konstanta yang tidak diketahui, sedangkan estimator adalah sebuah nilai statistik.
1 1
22
21
n
XnmfS
n
XfX
n
j jj
c
j jj
12
Histogram
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.25 0.75 1.25 1.75 2.25 2.75
Bin
Fre
qu
en
cy
Seberapa Representatif Fit Data tersebut? Plot data kontinu
sepanjang histogram dan cari kesamaannya
Data diskrit – bandingkan frekuensi yang terobservasi dengan frekuensi yang diharapkan
Coba plot Quantile-Quantile Plot
bttxF |)(|
^
Histogram
0
0.04
0.08
0.12
0.16
0.2
0 1 2 3 4 5 6 7 8 9 10
x
h(x)
Fitted Dist
Terobservasi
13
Quantile-Quantile Plot
Q-Q plot merupakan alat bantu yang berguna untuk evaluasi fit distribusi
Jika X adalah variabel acak dengan cdf F, maka q-quantile dari X adalah sedemikian sehingga
Di mana F memiliki invers, = F-1(q)
Jika {xi, i = 1,2, …., n} merupakan sampel data dari X dan {yj, j = 1,2, …, n} adalah observasi dengan urutan naik:
di mana j adalah ranking atau nomer urut
, for 0 1F( ) P(X ) q q
1 0.5is approximately -
j
j -y F
n
14
Quantile-Quantile Plot
Plot yj versus F-1( (j-0.5)/n) adalah Aproksimasi adalah garis lurus jika F merupakan anggota
kelompok distribusi yang sesuai Garis tersebut memiliki slope 1 jika F merupakan
anggota kelompok distribusi yang sesuai dengan nilai parameter yang sesuai
15
Quantile-Quantile Plot
Contoh: Cek apakah waktu pemasangan pintu terdistribusi normal [BCNN05] Observasi diurutkan dari yang paling kecil ke yang paling
besar:
yj di-plot versus F-1( (j-0.5)/n) dengan F memiliki distribusi normal dengan mean sampel (99.99 detik) dan varians sampel (0.28322 detik2)
j Value j Value j Value1 99.55 6 99.98 11 100.262 99.56 7 100.02 12 100.273 99.62 8 100.06 13 100.334 99.65 9 100.17 14 100.415 99.79 10 100.23 15 100.47
16
Quantile-Quantile Plot [BCNN05]
Contoh (lanjutan): Cek apakah waktu pemasangan pintu terdistribusi normal .
Garis lurus, mendukung
hipotesa distribusi normal distribution
Fungsi densitas distribusi normal
yang di-superimpose
17
Quantile-Quantile Plot [BCNN05]
Perhatikan hal-hal berikut ini ketika mengevaluasi linieritas q-q plot: Nilai yang terobservasi tidak pernah tepat berada pada
garis lurus Nilai yang terurut diberi peringkat, dan dengan demikian
tidak independen, tidak mungkin titik-titik tersebut tersebar sepanjang garis
Varians titik-titik ekstrim lebih tinggi dari yang di tengah. Linieritas titik-titda di tengah plot lebih penting.
Q-Q plot juga dapat digunakan untuk memeriksa homogenitas Cek apakah satu distribusi dapat merepresentasikan
sample set kedua-duanya. Mem-plot nilai urutan kedua sampel data terhadap satu
sama lain.
18
Uji Goodness-of-Fit [BCNN05]
Lakukan pengujian hipotesis pada distribusi data input dengan menggunakan: Kolmogorov-Smirnov (KS) test Chi-square test
Tidak ada distribusi tunggal yang benar pada aplikasi riil. Jika data yang tersedia hanya sedikit, distribusi kandidat
tidak mungkin diabaikan Jika banyak tersedia data, mungkin saja semua distribusi
kandidat diabaikan
19
Uji Chi-Square [BCNN05]
Bandingkan histogram data dengan bentuk fungsi distribusi kandidat
Valid untuk ukuran sampel yang besar di mana parameter diestimasi dengan maximum likelihood
Atur n observasi menjadi satu set k interval kelas atau cell, statistik uji adalah:
yang secara aproksimasi mengikuti distribusi chi-square dengan k-s-1 derajat kebebasan, di mana s = # parameter distribusi hipotesis yang di-estimasi oleh statistik sampel.
k
i i
ii
E
EO
1
220
)(
Frekuensi yang terobservasi
Frekuensi yang diharapkan
Ei = n*pi
dengan pi adalah probabilitas teoritis dari interval ke-i.
Minimum yang disarankan = 5
20
Uji Chi-Square Null hypothesis – observasi dari satu distribusi yang
sudah ditentukan tidak dapat diabaikan dari signifikansi α jika:
Catatan: Error pada cell dengan Ei’s yang kecil mempengaruhi
statistik uji lebih dari cell dengan Ei’s yang besar. Ukuran minimum Ei diperdebatkan: [BCNN05]
merekomendasikan nilai sebesar 3 atau lebih; jika tidak, gabungkan cell yang bersisian.
Uji hanya dirancang untuk distribusi diskrit ukuran sampel yang besar. Untuk distribusi kontinu, uji Chi-Square hanya merupakan pendekatan (yaitu, tingkat signifikansi hanya berlaku untuk n->∞).
2]1,1[
20 sk Didapat dari tabel
21
Uji Chi-Square Contoh 1: 500 bilangan acak dibangkitkan dengan
menggunakan random number generator; observasi dikategorisasi ke dalam cell dengan 0.1, antara 0 and 1. Pada tingkat signifikansi 0.1, apakah bilangan-bilangan ini IID U(0,1)? Interval Oi Ei [(Oi-Ei)^2]/Ei
1 50 50 02 48 50 0.083 49 50 0.024 42 50 1.285 52 50 0.086 45 50 0.57 63 50 3.388 54 50 0.329 50 50 0
10 47 50 0.18500 5.84
0.10. sisignifikan tingkat pada diterima Hipotesis
;68.14 tabeldari ;85.5 2]9,9.0[
20
22
Uji Chi-Square [BCNN05]
Contoh 2: Kedatangan kendaraanH0: variabel acak terdistribusi Poisson.
H1: variabel acak tidak terdistribusi Poisson.
Derajat kebebasan adalah k-s-1 = 7-1-1 = 5, dengan demikian, hipotesis tidak diterima pada tingkat signifikansi 0.05.
!
)(
x
en
xnpEx
i
x iFrekuensi terobservasi,
OiFrekuensi ekspektasi, Ei (Oi - Ei)
2/Ei
0 12 2.61 10 9.62 19 17.4 0.153 17 21.1 0.84 19 19.2 4.415 6 14.0 2.576 7 8.5 0.267 5 4.48 5 2.09 3 0.8
10 3 0.3> 11 1 0.1
100 100.0 27.68
7.87
11.62 Digabungkan karena min Ei
1.1168.27 25,05.0
20
23
Uji Chi-Square
Jika distribusi yang diuji kontinu:
dengan ai-1 dan ai adalah titik ujung interval kelas ke-ith
dan f(x) adalah pdf yang diasumsikan, F(x) adalah cdf yang diasumsikan.
Jumlah interval kelas yang diasumsikan (k):
Perhatikan: Pengelompokan data yang berbeda (yaitu, k) dapat mempengaruhi hasil uji hipotesis.
)()( )( 11
ii
a
ai aFaFdxxf pi
i
Sample Size, n Number of Class Intervals, k
20 Do not use the chi-square test
50 5 to 10
100 10 to 20
> 100 n1/2 to n/5
24
Uji Kolmogorov-Smirnov (KS) Selisih antara CDF F0(x) observasi dan CDF Fe(x)
ekspektasi harus kecil; formalisasi ide Q-Q plot. Tahap 1: Beri peringkat observasi dari terkecil
sampai terbesar:Y1 ≤ Y2 ≤ Y3 ≤ … ≤ Yn
Tahap 2: Definisikan Fe(x) = (#i: Yi ≤ x)/n Tahap 3: Hitung K sebagai berikut:
}1
)(),({max
|)()(|max
1 n
jYFYF
n
jK
xFxFK
jejenj
oex
25
Uji KS Contoh: Uji jika populasi bersifat eksponensial dengan
parameter β = 0.01; yaitu Fe(x) = 1 – e–βx; K[0.9,15] = 1.0298.
Uji KS untuk distribusi eksponensialbeta 0.01 N 15Y_j j (j/n)-F(Yj) F(Yj)-(j-1)/n
5 1 0.0178961 0.048770586 2 0.0750979 -0.00843126 3 0.1417645 -0.07509787
17 4 0.1103315 -0.0436648225 5 0.1121341 -0.0454674539 6 0.0770569 -0.0103902160 7 0.0154783 0.0511883661 8 0.0766842 -0.0100175472 9 0.0867523 -0.0200855974 10 0.1437806 -0.07711392
104 11 0.086788 -0.02012135150 12 0.0231302 0.04353651170 13 0.0493502 0.01731648195 14 0.0756074 -0.00894074229 15 0.1012665 -0.0345998
MAX 0.1437806 0.05118836
26
Uji KS
Uji KS sesuai untuk sampel yang kecil, baik kontinu maupun diskrit.
Uji KS, tidak seperti uji Chi-Square, memakai setiap observasi pada sampel tanpa mengelompokkan data menjadi cell (interval).
Uji KS bersifat pasti jika semua parameter distribusi ekspektasi telah diketahui.
27
Pemilihan Model tanpa Data Jika data tidak tersedia, beberapa sumber yang dapat
dipakai untuk memperoleh informasi mengenai proses adalah: Engineering data: seringkali produk atau proses memiliki rating
kinerja yang disediakan oleh manufacturer, atau peraturan perusahaan menentukan standard waktu atau produksi.
Pilihan pakar: orang-orang yang berpengalaman dengan proses tersebut, ataupun yang menyerupai, seringkali dapat memberikan waktu optimistik, pesimistik dan yang paling mungkin, dan mereka juga bisa mengetahui variabilitas.
Keterbatasan fisik atau konvensional: batasan fisik atas kinerja, batasan lain yang mempersempit kisaran proses input.
Karakteristik proses.
Distribusi uniform, triangular, dan beta sering digunakan sebagai model input. [lihat LK00]
28
Model Proses Kedatangan Proses Poisson Poisson non-stasioner Batch Arrival
29
Proses Poisson
Definisi: N(t) melambangkan jumlah kedatangan pada interval waktu [0,t].
Proses stokastik {N(t), t>=0} merupakan proses Poisson dengan mean rate jika: N(0) = 0 Kedatangan terjadi satu per satu {N(t), t>=0} memiliki inkremen stasioner – jumlah
kedatangan pada interval tertentu hanya bergantung pada panjang interval, bukan lokasinya
{N(t), t>=0} memiliki inkremen independen – jumlah kedatangan pada interval waktu disjoint adalah independen.
Dan …
0}2)({
lim
}1)({lim
h
hNPh
hNP
oh
oh
30Stasioner dan independen Memoryless
Proses Poisson: Waktu Antar Kedatangan Anggap waktu antar kedatangan proses Possion process (A1,
A2, …), dengan Ai adalah waktu antara kedatangan i dan kedatangan i+1
Kedatangan pertama terjadi setelah waktu t jika dan hanya jika tidak ada kedatangan pada interval [0,t], dengan demikian:
P{A1 > t} = P{N(t) = 0} = e-t
P{A1 <= t} = 1 – e-t [cdf exp()] Waktu antar kedatangan, A1, A2, …, terdistribusi eksponensial
dan independen dengan mean 1/Penghitungan kedatangan ~ Poisson()
Waktu antar kedatangan ~
Exp(1/)
31
Splitting: Anggap setiap event proses Poisson dapat diklasifikasikan
sebagai Type I, dengan probabilitas p dan Type II, dengan probabilitas 1-p.
N(t) = N1(t) + N2(t), dengan N1(t) dan N2(t) adalah proses Poisson dengan rate p dan (1-p)
Pooling: Dua proses Poisson di-pool bersama N1(t) + N2(t) = N(t), dengan N(t) adalah proses Poisson
dengan rate 1 + 2
Proses Poisson: Splitting dan Pooling
N(t) ~ Poisson()
N1(t) ~ Poisson[p]
N2(t) ~ Poisson[(1-p)]
p
(1-p)
N(t) ~ Poisson(12)N1(t) ~ Poisson[]
N2(t) ~ Poisson[]
1
2
32
Proses Poisson Non-stasioner (NSPP) Proses Poisson tanpa inkremen stasioner, dikarakterisasikan
oleh (t), kecepatan kedatangan pada waktu t. Jumlah kedatangan ekspektasi pada waktu t, (t):
Menghubungkan proses Poisson stasioner n(t) dengan rate dan NSPP N(t) dengan rate (t): Tentukan waktu kedatangan proses stasioner dengan rate
= 1 sebagai t1, t2, …, dan waktu kedatangan NSPP dengan rate (t) sebagai T1, T2, …, kita ketahui:
ti = (Ti)
Ti = (ti)
tλ(s)dsΛ(t)
0
33
Contoh: Misalkan kedatangan di Kantor Pos memiliki rate 2 per menit dari jam 8 pagi sampai 12 siang, dan kemudian 0.5 per menit sampai jam 4 sore.
Tentukan t = 0 mewakili jam 8 pagi, NSPP N(t) memiliki fungsi kecepatan:
Jumlah kedatangan ekspektasi pada waktu t:
Dengan demikian, distribusi probabilitas jumlah kedatangan antara jam 11 pagi dan 2 siang.
P[N(6) – N(3) = k] = P[N((6)) – N((3)) = k]= P[N(9) – N(6) = k]= e(9-6)(9-6)k/k! = e3(3)k/k!
84 ,5.0
40 ,2)(
t
tt
84 ,6
25.02
40 ,2)( 4
0 4
tt
dsds
ttt t
Proses Poisson Non-stasioner (NSPP)
34
Batch Process N(t) adalah jumlah batch yang datang pada waktu
t. Jika waktu antara kedatangan batch adalah
variabel acak eksponensial IID, {N(t), t≥0} dapat dimodelkan sebagai proses Poisson.
X(t) = jumlah total pelanggan yang datang sampai waktu t; Bi = jumlah pelanggan pada batch ke-i; maka
Jika Bi’s adalah variabel acak IID yang independen terhadap {N(t) t≥0}, dan jika {N(t), t≥0} adalah proses Poisson, maka proses stokastik {X(t), t≥0} adalah proses Compound Poisson
0,)()(
1
tBtX
tN
ii