PEMODELAN BIOLOGICAL OXYGEN DEMAND (BOD ...repository.unair.ac.id/55936/2/KKC KK ST.S 55 -16 Per...
Transcript of PEMODELAN BIOLOGICAL OXYGEN DEMAND (BOD ...repository.unair.ac.id/55936/2/KKC KK ST.S 55 -16 Per...
PEMODELAN BIOLOGICAL OXYGEN DEMAND (BOD) DAN CHEMICAL
OXYGEN DEMAND (COD) DENGAN PENDEKATAN REGRESI
NONPARAMETRIK BIRESPON PADA DATA LONGITUDINAL
BERDASARKAN ESTIMATOR SPLINE TRUNCATED
(STUDI KASUS: SUNGAI BRANTAS DI SEKITAR LOKASI INDUSTRI)
SKRIPSI
WINDHU MANJA PERMATA
PROGRAM STUDI S1 STATISTIKA
DEPARTEMEN MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS AIRLANGGA
2016
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
Scanned by CamScanner
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
Scanned by CamScanner
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
iv
PEDOMAN PENGGUNAAN SKRIPSI
Skripsi ini tidak dipublikasikan, namun tersedia diperpustakaan dalam
lingkup Universitas Airlangga, diperkenankan untuk dipakai sebagai referensi
kepustakaan, tetapi pengutipan harus seijin penulis dan harus menyebutkan
sumbernya sesuai kebiasaan ilmiah. Dokumen skripsi ini merupakan hak milik
Universitas Airlangga.
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
Scanned by CamScanner
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
vi
KATA PENGANTAR
Alhamdulillah puji syukur kehadirat Allah SWT atas berkat, rahmat, dan
hidayah yang telah diberikan sehingga penulis dapat menyelesaikan skripsi yang
berjudul “Pemodelan Biomedical Oxygen Demand (BOD) dan Chemical Oxygen
Demand (COD) dengan Pendekatan Regresi Nonparametrik Birespon pada Data
Longitudinal Berdasarkan Estimator Spline Truncated (Studi Kasus: Sungai
Brantas di Sekitar Lokasi Industri)”.
Dalam kesempatan ini penulis menyampaikan penghargaan dan ucapan
terima kasih kepada sebesar-besarnya kepada :
1. Kedua Orang Tua tercinta, Bapak Suhadi dan Ibu Dewi Aliah, adik tersayang,
Bhaldha Arija Ghoza serta keluarga besar penulis yang tak henti-hentinya
mendoakan dan telah memberikan semangat, kasih sayang, kepercayaan, dan
pengorbanan yang tiada terkira besarnya.
2. Ibu Dr. Nur Chamidah, M.Si selaku dosen pembimbing I dan Bapak Dr. Ardi
Kurniawan, M. Si selaku dosen pembimbing II yang telah memberikan
bimbingan dan arahan kepada penulis dari awal kuliah hingga menyelesaikan
proposal skripsi ini.
3. Bapak Drs. Sediono, M.Si selaku Dosen Wali selama menjadi mahasiswa
Statistika Universitas Airlangga yang telah memberikan bimbingan dan arahan,
serta segenap Dosen Statistika yang telah memberikan ilmu pengetahuan
selama perkuliahan.
4. Keluarga besar “Statistika Unair”, “Statistika Unair 2012”, “HIMATIKA
2014”, “HIMASTA UNAIR” dan keluarga “BPH HIMATIKA 2014” untuk
pengalaman dan pembelajaran selama masa kuliah.
5. Teman-teman seperjuangan semester 8, atas bantuan, dukungan, serta
kekompakan selama berjuang mengerjakan skripsi dan menyelesaikan kuliah.
6. Putri, Ria, Inesia, Intan, dan Mifta yang telah membantu penulis dalam
menyelesaikan skripsi.
7. Keluarga “Kost Ceria”, Novita, Nuke, Umro, dan Aiffa, yang selalu
mengingatkan, mendengarkan keluh kesah, dan memberi dukungan.
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
vii
8. “Dewan Komodo”, Dian, Lussi, Muiz, Muhindro, Adit, Ali, Mahenda, Arief,
Iswah, Alfin, Edo, dan Firman” yang telah menjadi keluarga dan mengajarkan
banyak hal.
Penulis menyadari bahwa skripsi ini masih memiliki banyak kekurangan,
oleh karena itu diharapkan kritik dan saran yang membangun dari semua pihak.
Surabaya, Agustus 2016
Windhu Manja Permata
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
Windhu Manja Permata, 2016. Pemodelan Biological Oxygen Demand (BOD) dan Chemical Oxygen Demand (COD) dengan Pendekatan Regresi Nonparametrik Birespon pada Data Longitudinal Berdasarkan Estimator Spline Truncated (Studi Kasus: Sungai Brantas di Sekitar Lokasi Industri). Skripsi ini dibawah bimbingan Dr. Nur Chamidah, M.Si. dan Dr. Ardi Kurniawan M. Si, Departemen Matematika, Fakultas Sains dan Teknologi, Universitas Airlangga, Surabaya.
ABSTRAK
Wilayah Sungai (WS) Brantas yang berada di provinsi Jawa Timur ditetapkan sebagai salah satu sungai strategis nasional dan merupakan sungai yang mempunyai manfaat salah satunya untuk pembuangan limbah industri. Sebagian besar limbah industri masih belum melalui proses pengolahan ketika dibuang ke sungai. Tujuan penelitian ini adalah untuk memodelkan kandungan Biological Oxygen Demand (BOD) dan Chemical Oxygen Demand (COD) sebagai parameter pencemaran air oleh limbah industri di 18 titik pengamatan WS Brantas di sekitar lokasi industri yaitu Dinas Pemotongan Hewan Malang, PT. Pindad, PT. Eka Mas Fortuna, Peternakan Babi Sempulur, Peternakan Babi Delta, CV. Sartimbul, Peternakan Babi Hanjoyo, PT. Setia Kawan, PT. Surya Zig Zag, PT. Surya Pamenang, UD. Sumberejo, PT. Jaya Kertas, PT. Cheil Jedang, PT. Ajinomoto Indonesia, PT. Darmala, PT. Pakerin, PT. Sateliti Sriti, PT. Tjiwi Kimia. Penelitian ini menggunakan pendekatan regresi nonparametrik birespon pada data longitudinal berdasarkan estimator spline truncated dengan menggunakan satu prediktor, yaitu Total Suspended Solid (TSS). Hasil penelitian dengan menggunakan kriteria Generalized Cross Validation (GCV) yaitu dengan memilih nilai GCV yang minimum diperoleh nilai nilai GCV minimum adalah 0,1929118 sehingga parameter smoothing optimum yaitu orde respon 1 adalah 1, dan orde respon 2 adalah 2, dengan 5 titik knot optimum, yaitu 0,01135; 0,022433; 0,04995; 0,1096; 0,26. Kesimpulan dari hasil estimasi adalah nilai BOD dan COD terendah adalah titik pengamatan di sekitar lokasi PT Pindad dengan nilai TSS pada titik pengamatan di WS Brantas di sekitar lokasi PT Pindad terletak pada interval 0,01135x < , sedangkan nilai BOD dan COD BOD tertinggi adalah pada titik pengamatan di sekitar lokasi Peternakan Babi Hanjoyo dan UD. Sumberejo dengan nilai TSS pada titik pengamatan di WS Brantas di sekitar lokasi Peternakan Babi Hanjoyo dan UD. Sumberejo terletak pada interval
0, 26x ≥ .
Kata Kunci : BOD, COD, TSS, Sungai Brantas, Limbah Industri, Regresi Nonparametrik, Birespon, Data Longitudinal, Spline Truncated
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
Windhu Manja Permata, 2016. Modeling of Biological Oxygen Demand (BOD) and Chemical Oxygen Demand (COD) with Biresponse Nonparametric Regression Approach in Longitudinal Data based of Spline Truncated Estimator (Case Study: Brantas River Around the Industry Location). This Skripsi is under advised by Dr. Nur Chamidah, M.Si. and Dr. Ardi Kurniawan, M.Si., Mathematics Departemen, Faculty of Science and Technology, Airlangga University, Surabaya.
ABSTRACT
Wilayah Sungai (WS) Brantas in the province of East Java established as one of the national strategic which has the advantage of one of them for the disposal of industrial waste. Most industrial waste have not through the treatment process when thrown into the river. The purpose of this study is to estimation model of Biological Oxygen Demand (BOD) and Chemical Oxygen Demand (COD) as a parameter of water pollution by industrial waste in the 18 observation points around the location of industry of WS Brantas, there are, Dinas Pemotongan Hewan Malang, PT. Pindad, PT. Eka Mas Fortuna, Peternakan Babi Sempulur, Peternakan Babi Delta, CV. Sartimbul, Peternakan Babi Hanjoyo, PT. Setia Kawan, PT. Surya Zig Zag, PT. Surya Pamenang, UD. Sumberejo, PT. Jaya Kertas, PT. Cheil Jedang, PT. Ajinomoto Indonesia, PT. Darmala, PT. Pakerin, PT. Sateliti Sriti, and PT. Tjiwi Kimia. This study uses biresponse nonparametric regression model estimation on longitudinal data based on spline truncated by using one predictor, namely Total Suspended Solid (TSS). The results is using criteria of Generalized Cross Validation (GCV) by selecting the minimum value of GCV. The minimum value of GCV is 0.1929118 so that, the optimum smoothing parameter for response 1 is in orde 1 , and for response 2 is in orde 2, with 5 knots optimum point , there are, 0.01135; 0.022433; 0.04995; 0.1096; 0.26. The conclusion of the estimation is the lowest value of BOD and COD is at observation points that around the location of PT Pindad with TSS value is at the interval 0,01135x < , while the highest value of BOD and COD is at observation points that around the site of Peternakan Babi Hanjoyo and UD. Sumberejo with TSS values is at intervals 0,26x ≥ .
Keyword : BOD, COD, TSS, Brantas River, Industrial Waste, Nonparametric Regression, Biresponse, Longitudinal Data, Spline Truncated
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
DAFTAR ISI
LEMBAR JUDUL ........................................................................................... i
LEMBAR PERNYATAAN ............................................................................. ii
LEMBAR PENGESAHAN ............................................................................. iii
PEDOMAN PENGGUNAAN SKRIPSI ......................................................... iv
LEMBAR ORISINALITAS ............................................................................ v
KATA PENGANTAR ..................................................................................... vi
ABSTRAK ....................................................................................................... viii
ABSTRACT ..................................................................................................... ix
DAFTAR ISI .................................................................................................... x
DAFTAR TABEL ............................................................................................ xiii
DAFTAR GAMBAR ....................................................................................... xiv
DAFTAR LAMPIRAN .................................................................................... xv
BAB I PENDAHULUAN
1.1 Latar Belakang ..................................................................................... 1
1.2 Rumusan Masalah ................................................................................ 6
1.3 Tujuan ................................................................................................... 7
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
1.4 Manfaat ................................................................................................. 7
1.5 Batasan Masalah ................................................................................... 8
BAB II TINJAUAN PUSTAKA
2.1 Sungai Brantas ..................................................................................... 9
2.2 Baku Mutu Air Limbah dan Daya Tampung Beban Pencemaran........ 10
2.3 Air Limbah Industri.............................................................................. 10
2.4 BOD dan COD ..................................................................................... 11
2.5 Total Suspended Solid (TSS) ............................................................... 12
2.6 Matriks ................................................................................................. 13
2.7 Regresi Nonparametrik ........................................................................ 17
2.8 Kuantil .................................................................................................. 18
2.9 Estimator Spline Truncated .................................................................. 19
2.10 Data Longitudinal................................................................................. 23
2.11 Homoskedastisitas dan Heterokedastisitas ........................................... 24
2.12 Uji Box’s M ......................................................................................... 25
2.13 Uji Korelasi Pearson ............................................................................ 27
2.14 Regresi Nonparametrik Birespon Spline Truncated ............................ 28
2.15 Weighted Least Square ......................................................................... 29
2.16 Regresi Nonparametrik Birespon pada Data Longitudinal Berdasarkan
Estimator Spline Truncated .................................................................. 30
2.17 Open Source Software (OSS)-R ........................................................... 32
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
BAB III METODE PENELITIAN
3.1 Data dan Sumber Data ......................................................................... 35
3.2 Variabel Penelitian ............................................................................... 36
3.3 Langkah Analisis .................................................................................. 37
BAB IV HASIL DAN PEMBAHASAN
4.1 Estimasi Model BOD dan COD dengan Pendekatan Regresi
Nonparametrik Birespon pada Data Longitudinal Berdasarkan
Estimator Spline Truncated .................................................................. 43
4.2 Menganalisis dan Menginterpretasi Hasil Estimasi Model BOD dan
COD dengan Pendekatan Regresi Nonparametrik Birespon pada
Data Longitudinal Berdasarkan Estimator Spline Truncated............... 47
BAB V PENUTUP
5.1 Kesimpulan .......................................................................................... 55
5.2 Saran ..................................................................................................... 56
DAFTAR PUSTAKA ...................................................................................... 57
LAMPIRAN ..................................................................................................... 58
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
DAFTAR TABEL
Nomor Judul Tabel Halaman
3.1 Daftar Industri Titik Pengambilan Sampel Limbah ......................................28
3.2 Variabel-Variabel Penelitian .........................................................................29
4.1 Pemilihan Orde Optimum Berdasarkan Jumlah Knot Optimum pada Data
BOD dan COD (Tanpa Pembobot) ................................................................37
4.2 Pemilihan Orde Optimum Berdasarkan Jumlah Knot Optimum pada Data
BOD dan COD (Dengan Pembobot) ..............................................................38
4.3 Model BOD dan COD Untuk Setiap Titik Pengamatan di WS Brantas di
Sekitar Lokasi Industri ...................................................................................41
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
DAFTAR GAMBAR
Nomor Judul Gambar Halaman
4.1 Plot Data Pengamatan BOD terhadap TSS ..................................................... 35
4.2 Plot Data Pengamatan COD terhadap TSS ..................................................... 36
4.3 Plot Observasi dan Estimasi Data BOD terhadap TSS ................................... 43
4.4 Plot Observasi dan Estimasi Data COD terhadap TSS ................................... 44
4.5 Plot Hasil Estimasi BOD dan COD terhadap TSS .......................................... 44
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
DAFTAR LAMPIRAN
Nomor Judul
1 Data BOD, COD, dan TSS 18 Titik WS Brantas di Sekitar Lokasi
Industri
2 Program Estimasi Model BOD dan COD dengan Pendekatan Regresi
Nonparametrik Birespon pada Data Longitudinal Berdasarkan
Estimator Spline Truncated Menggunakan Aplikasi OSS-R
3 Output Program Estimasi Model BOD dan COD dengan Pendekatan
Regresi Nonparametrik Birespon pada Data Longitudinal Berdasarkan
Estimator Spline Truncated Menggunakan Aplikasi OSS-R
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
BAB I
PENDAHULUAN
1.1 Latar Belakang
Sungai merupakan sumber air permukaan yang memberikan manfaat kepada
kehidupan manusia (Sukadi, 1999). Perum Jasa Tirta 1 (PJT 1) dalam “Laporan
Pemantauan Kualitas Air di Wilayah Sungai Brantas dan Wilayah Sungai
Bengawan Solo Tahun 2014” menyatakan Wilayah Sungai (WS) Brantas yang
berada di provinsi Jawa Timur ditetapkan sebagai salah satu sungai strategis
nasional dan merupakan sungai yang mempunyai manfaat untuk kebutuhan
sebagai air baku air bersih, untuk proses produksi, PLTA, pertanian, perikanan
sekaligus sebagai sungai untuk pembuangan limbah industri, pertanian, perikanan
dan domestik.
Hasil penelitian dari Krisnawati dkk (2015) yang berjudul “Perancangan
Moolief Biorefactor Untuk Remediasi Air Sungai Brantas Kediri Tercemar
Limbah Domestik dan Industri” disebutkan di WS Brantas terdapat 483 industri
yang berpotensi membuang limbahnya yang berpengaruh langsung pada kualitas
air sungai. Diketahui bahwa hulu hingga hilir kali Brantas telah terdeteksi
konsentrasi senyawa estradiol 42-220 ng/L. Kondisi tersebut membahayakan
karena dapat memacu terjadinya feminisasi ikan yang berujung kepunahan.
Setiap aliran air permukaan seperti sungai memiliki kemampuan self
purification yaitu kemampuan penjernihan kembali secara alamiah dalam kurun
waktu yang berbeda tergantung pada beban pencemarnya. Pada badan-badan air
yang mengalami pencemaran dapat dilihat melalui beberapa indikator secara fisik,
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
kimia, maupun biologis (Ramadhani, 2016). Berdasarkan kemampuan sungai
tersebut, maka seharusnya beban limbah yang dibuang oleh industri mengikuti
kondisi sungai tempat limbah tersebut dibuang, dengan kata lain setiap industri
memiliki ambang batas beban limbah yang berbeda, tergantung letak pembuangan
limbahnya di sungai.
Sebagian besar limbah industri masih belum melalui proses pengolahan
ketika dibuang ke sungai. Kondisi ini sangat memprihatinkan, mengingat banyak
sekali kegunaan sungai yang menjadi tempat pembuangan tersebut . Laporan PJT
1 (2014) menyebutkan bahwa status mutu air di WS Brantas cenderung tercemar
berat, hanya 25,5% yang tercemar sedang dan sekitar 52,38% air buangan limbah
industri belum memenuhi baku mutu. Untuk itu perlu adanya penelitian baku
mutu air sungai sebagai tempat pembuangan limbah industri untuk mengetahui
beban limbah yang terdapat di dalam wilayah sungai Brantas supaya mencegah
limbah industri yang overload dan menjaga kemampuan self purification sungai
tersebut.
Biological Oxygen Demand (BOD) dan Chemical Oxygen Demand (COD)
adalah parameter yang umumnya dipakai untuk mengenal adanya pencemaran
dalam air. BOD adalah banyaknya oksigen yang dibutuhkan oleh bakteri untuk
menguraikan bahan pencemar dalam kondisi baku, sedangkan COD
mencerminkan kebutuhan bahan kimia yang dibutuhkan unuk mengoksidasi
bahan pencemar yang ada dalam air. Oleh karena itu nilai BOD dan COD yang
tinggi menunjukkan air tercemar yang berat (Herlambang, 2006). BOD dan COD
sama-sama menunjukkan kebutuhan jumlah oksigen yang digunakan untuk
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
mengoksidasi zat-zat polutan di dalam air. BOD dan COD juga dapat
menggambarkan bahan organik yang terdapat dalam air (PJT1, 2014). BOD
menggambarkan banyaknya oksigen yang dibutuhkan oleh mikroorganisme untuk
mengoksidasi bahan organik karbon yang terkandung di dalam air secara
sempurna dengan menggunakan ukuran proses biokimia yang terjadi di dalam air
limbah pada periode 5 hari dan pada suhu 20oC, sedangkan COD ditentukan
dengan menggunakan oksidator kuat kalium bikromat, asam sulfat pekat, dan
perak sebagai katalis. Lamanya waktu yang dibutuhkan untuk menentukan BOD
dan penggunaan bahan-bahan berbahaya dan beracun dalam analisis COD,
sehingga diperlukan metode alternatif lain yang lebih mudah dan ramah
lingkungan untuk menetukan BOD dan COD dalam air (Simata, 2011).
Nilai BOD dipengaruhi oleh jumlah Total Suspended Solid (TSS) dan juga
zat organik yang ada dalam air. Nilai COD adalah total keseluruhan dari pengotor
TSS, zat organik, mineral bervalensi rendah, ditambah dengan zat kimia yang
memakan oksigen (Nurbana, 2015). Ramadhani (2016) menggunakan parameter
BOD, COD, dan TSS untuk menganalisis pencemaran air sungai Bengawan Solo
akibat limbah industri di kecamatan Kebakkramat kabupaten Karanganyar.
Krisnawati, dkk (2015) menggunakan parameter BOD dan COD untuk
mengetahui kualitas air sungai Brantas di wilayah Kediri tercemar limbah
domestik dan industri.
Berdasarkan peraturan gubernur Jawa Timur Nomor 72 Tahun 2013 tentang
Baku Mutu Air Limbah Bagi Industri dan / Kegiatan Usaha Lainnya, parameter
yang dianalisa diantaranya adalah, Biological Oxygen Demand (BOD), Chemical
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
Oxygen Demand (COD), Total Suspended Solid (TSS) dan disesuaikan dengan
kegiatan usahanya. Parameter TSS digunakan sebagai parameter air limbah dan
sebagai parameter pencemaran karena perannya sebagai penduga bahan organik
dan kaitannya dengan penurunan kandungan oksigen terlarut perairan. TSS
ditentukan dengan menghitung jumlah berat lumpur kering dalam mg/l yang telah
mengalami penyaringan dengan membran berukuran 0,45 mikron dan dipanaskan
dalam oven dengan suhu 105oC selama 1 jam. Oleh karena itu, disimpulkan
adanya korelasi yang erat antara BOD dan COD, dan dalam baku mutu air limbah
penentuan parameter BOD dan COD dapat didekati dengan parameter TSS
(Nurbana, 2015).
Pendekatan parametrik mengasumsikan bahwa pola kecenderungan data
pada kurva regresi mengacu pada suatu bentuk fungsi tertentu, seperti linier,
kuadrat, kubik, dan sebagainya (Budiantara, 2012), apabila data tidak memenuhi
asumsi tersebut maka pemodelan data harus diselesaikan dengan pendekatan
nonparametrik..
Sari (2016) menyatakan bahwa kurva regresi pada pendekatan
nonparametrik hanya diasumsikan mulus atau smooth, sehingga pendekatan
nonparametrik memiliki fleksibilitas yang tinggi karena data diharapkan mencari
sendiri bentuk estimasi kurva regresinya tanpa dipengaruhi oleh faktor
subyektifitas peneliti. Pemaparan sebelumnya telah menjelaskan bahwa TSS
merupakan parameter yang mempengaruhi BOD dan COD, terdapat korelasi
yang kuat diantara BOD dan COD, sehingga untuk mengatasi masalah tersebut
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
digunakan regresi nonparametrik birespon dengan BOD dan COD sebagai respon
dan TSS sebagai prediktor.
Berdasarkan waktu pengumpulannya data dibedakan menjadi tiga, yaitu
data cross sectional, longitudinal, dan time series. Pemantauan kualitas air
dilakukan terus menerus sehingga data yang terkumpul dapat menggambarkan
keadaan sesungguhnya dari keadaan lingkungan yang dipantau (PJT1, 2014).
Dalam kasus ini, BOD, COD, dan TSS merupakan data yang diperoleh dari
pengamatan dalam periode waktu yang berbeda beserta variabel yang
mempengaruhinya, sehingga untuk menjelaskan dinamika perubahan kondisi agar
informasi yang diperoleh lebih lengkap, data yang digunakan pada skripsi ini
adalah data longitudinal.
Salah satu pendekatan untuk mengestimasi fungsi dalam regresi
nonparametrik adalah spline truncated. Spline truncated merupakan model
polinomial tersegmen yang memberikan fleksibilitas yang lebih baik daripada
polinomial biasa. Sifat tersegmen inilah yang memungkinkan model regresi spline
truncated menyesuaikan diri secara efektif terhadap karakteristik lokal data.
Penelitian tentang regresi nonparamretrik birespon pada data longitudinal sudah
pernah dilakukan oleh Sari (2016) dengan menggunakan Weighted Spline
Truncated. Dalam skripsi ini, peneliti menggunakan Weighted Spline Truncated
sebagai estimator untuk diterapkan pada data longitudinal BOD, COD, dan TSS.
Estimasi kurva regresi nonparametrik spline truncated dapat dilakukan dengan
memilih parameter smoothing, yaitu orde, banyaknya titik knot, dan titik knot
(Sari, 2016). Pemilihan parameter smoothing yang optimal dilakukan peneliti
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
dengan menggunakan kriteria Generalized Cross Validation (GCV) yaitu dengan
memilih nilai GCV yang minimum.
Berdasarkan pemaparan di atas, peneliti ingin membahas pencemaran
sungai Brantas yang berada di sekitar lokasi industri dengan pendekatan regresi
nonparametrik birespon dengan menggunakan data longitudinal berdasarkan
estimator spline truncated dengan BOD dan COD sebagai respon dan TSS
sebagai prediktor. Penelitian dalam skripsi ini tidak dapat dilakukan secara
manual, untuk itu dibutuhkan bantuan aplikasi dalam penyelesaiannya. Salah satu
aplikasi yang dapat digunakan untuk membantu penyelesaian penilitian ini adalah
aplikasi Open Source Software (OSS) R.
1.2 Rumusan Masalah
Berdasarkan latar belakang yang telah diuraikan, dapat dirumuskan masalah
sebagai berikut:
1. Bagaimana mengestimasi model BOD dan COD sebagai parameter
kualitas air sungai Brantas di sekitar lokasi industri dengan pendekatan
regresi nonparametrik birespon pada data longitudinal berdasarkan
estimator spline truncated menggunakan program pada aplikasi OSS-R?
2. Bagaimana menganalisis dan menginterpretasi hasil estimasi model BOD
dan COD sebagai parameter kualitas air sungai Brantas di sekitar lokasi
industri dengan pendekatan regresi nonparametrik birespon pada data
longitudinal berdasarkan estimator spline truncated?
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
1.3 Tujuan
Tujuan yang ingin dicapai dalam skripsi ini diantaranya:
1. Mengestimasi model BOD dan COD sebagai parameter kualitas air
sungai Brantas di sekitar lokasi industri dengan pendekatan regresi
nonparametrik birespon pada data longitudinal berdasarkan estimator
spline truncated menggunakan program pada aplikasi OSS-R
2. Menganalisis dan menginterpretasi hasil estimasi model BOD dan COD
sebagai parameter kualitas air sungai Brantas di sekitar lokasi industri
dengan pendekatan regresi nonparametrik birespon pada data
longitudinal berdasarkan estimator spline truncated.
1.4 Manfaat
Skripsi ini diharapkan dapat memberikan manfaat sebagai berikut:
1. Menambah wawasan tentang estimasi model regresi nonparametrik
birespon pada data longitudinal berdasarkan estimator spline truncated.
2. Mengetahui estimasi BOD dan COD sebagai parameter kualitas air
sungai Brantas di sekitar lokasi industri untuk dapat digunakan sebagai
acuan dalam pembuangan limbah industri di sungai Brantas
3. Memberikan masukan kepada pemerintah, khususnya PJT 1 dalam
mengukur BOD dan COD dengan cara yang lebih mudah agar nantinya
dapat menindaklanjuti peraturan pembuangan limbah industri di WS
Brantas.
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
1.5 Batasan Masalah
Agar pembahasan tidak melebar, maka masalah perlu dibatasi sebagai
berikut:
1. Ruang lingkup pembahasan model regresi nonparametrik birespon pada
data longitudinal BOD dan COD dalam skripsi ini hanya dibatasi satu
variabel prediktor, yaitu TSS.
2. Data pengamatan diambil dari 18 titik WS Brantas yang berada di sekitar
lokasi industri.
Penelitian dalam skripsi ini menggunakan estimator spline truncated dan dalam
penentuan parameter smoothing optimal digunakan kriteria GCV.
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
BAB II
TINJAUAN PUSTAKA
Pada bab ini akan dibahas mengenai beberapa tinjauan pustaka yang akan
digunakan untuk pembahasan pada bab-bab berikutnya.
2.1 Sungai Brantas
Wilayah Sungai (WS) Brantas merupakan WS terbesar kedua di pulau Jawa,
terletak di propinsi Jawa Timur. Sungai Brantas mempunyai panjang ± 320 km
dan memiliki luas wilayah sungai ± 14.103 km2 yang mencakup ± 25% luas
propinsi Jawa Timur atau ± 9% luas pulau Jawa. WS Brantas terdiri dari empat
Daerah Aliran Sungai (DAS) yaitu DAS Brantas, DAS Tengah, DAS Ringin
Bandulan, dan DAS Kondang Merak. WS Brantas berhulu di sumber Brantas kota
Batu, mengalir melewati wilayah Malang, Blitar, Tulungagung, Kediri, Nganjuk,
Jombang, Mojokerto dan berhilir di Sidoarjo dan Surabaya dengan luas wilayah ±
1.188.575 Ha.
Sungai Brantas merupakan sungai strategis sebagai penyedia air baku untuk
berbagai kebutuhan seperti, sumber tenaga pada PLTA, PDAM, irigasi, proses
produksi industri, dan lain-lain. Peran sungai Brantas sangat vital dalam
menyangga kehidupan masyarakat Jawa Timur. Aktivitas yang ada saat ini di
sungai Brantas berupa kegiatan-kegiatan industri, penambangan bahan galian
golongan C, transportasi air, perikanan dan pertanian. Jenis kegiatan industri yang
berada di sekitar WS Brantas terdiri dari industri kertas, gula, minuman, tekstil,
makanan, peternakan, daging, susu, minyak goreng, sabun, baja, pelapisan logam,
dan industri kimia (PJT 1, 2015)
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
2.2 Baku Mutu Air Limbah dan Daya Tampung Beban Pencemaran
Air limbah adalah sisa dari suatu hasil usaha dan atau kegiatan yang
berwujud cair. Baku mutu air limbah adalah ukuran batas atau kadar unsur
pencemar dan atau jumlah unsur pencemar yang ditenggang keberadaannya dalam
air limbah yang akan dibuang atau dilepas ke dalam sumber air dari suatu usaha
dan atau kegiatan. Dalam menentukan baku mutu air limbah yang diizinkan,
didasarkan pada daya tampung beban pencemaran pada sumber air. Beban
pencemaran adalah jumlah suatu unsur pencemar yang terkandung dalam air atau
air limbah. Sedangkan daya tampung beban pencemaran adalah kemampuan air
pada suatu sumber air untuk menerima masukan beban pencemaran tanpa
mengakibatkan air tersebut menjadi cemar (Peraturan Pemerintah Republik
indonesia No.82, 2001).
2.3 Air Limbah Industri
Air limbah industri adalah air yang berasal dari rangkaian proses produksi
suatu industri dengan demikian maka air limbah tersebut dapat mengandung
komponen yang berasal dari proses produksi tersebut dan apabila dibuang ke
lingkungan tanpa pengelolaan yang benar tentunya akan dapat mengganggu badan
air penerima. Dampak pencemaran air limbah industri terhadap mutu badan air
penerima bervariasi tergantung kepada sifat dan jenis limbah, volume dan
frekuensi air limbah yang dibuang oleh masing-masing industri.
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
Salah satu jenis air limbah industri yang dapat menyebabkan terjadinya
pencemaran lingkungan adalah air limbah dengan kandungan organik tinggi.
Karakteristik air limbah organik tinggi ditunjukan dengan tingginya parameter
BOD dan COD dalam air limbah. Contoh industri dengan air limbah organik
tinggi adalah industri tapioka, tahu, gula, kecap, sitrat, asam glutamat, tekstil, bir,
alkohol dan lain-lain. Kandungan BOD yang tinggi dalam air limbah industri
dapat menyebabkan turunnya oksigen perairan, keadaan anaerob (tanpa oksigen),
sehingga dapat mematikan ikan dan menimbulkan bau busuk. Untuk kandungan
COD yang tinggi dalam air limbah pengaruhnya terhadap lingkungan tergantung
dari zat organiknya, kalau dapat diurai oleh mikroorganisme pengaruhnya seperti
BOD, tetapi untuk yang tidak dapat diurai oleh mikroorganisme pengaruhnya
tergantung dari jenis zat organik yang ada di dalam air (Moertinah, 2010).
2.4 Biological Oxygen Demand dan Chemical Oxygen Demand
Biological Oxygen Demand (BOD) dan Chemical Oxygen Demand (COD)
keduanya dapat dikatakan menggambarkan bahan organik (PJT 1, 2015). BOD
dan COD juga dapat dikatakan menggambarkan banyaknya oksigen yang
digunakan untuk mengoksidasi bahan organik di dalam air. BOD menggambarkan
banyaknya oksigen yang dibutuhkan oleh mikroorganisme untuk mengoksidasi
bahan organik karbon yang terkandung di dalam air secara sempurna dengan
menggunakan ukuran proses biokimia yang terjadi di dalam air limbah pada
periode tertentu biasanya 5 hari dan pada suhu tertentu biasanya 20oC. BOD tidak
menunjukkan jumlah bahan organik yang sebenarnya, tetapi hanya mengukur
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
secara relatif jumlah O2 yang digunakan untuk mengoksidasi bahan-bahan
buangan tersebut. Jika konsumsi mikroorganisme terhadap O2 tinggi yang
ditunjukkan dengan semakin kecilnya O2 terlarut, maka kandungan bahan-bahan
buangan di dalam air tersebut tinggi.
COD atau kebutuhan oksigen kimia adalah jumlah oksigen yang dibutuhkan
untuk mengoksidasi zat-zat organik yang ada dalam air oleh senyawa-senyawa
oksidator kuat kalium bikromat, asam sulfat pekat, (K2Cr2O7) dan perak sebagai
katalis. Nilai COD menunjukkan kebutuhan oksigen yang diperlukan untuk
menguraikan kandungan bahan organik dalam air secara kimiawi, khususnya bagi
senyawa organik yang tidak dapat diuraikan oleh proses biologis (Jatmiko, 2007).
2.5 Total Suspended Solid (TSS)
Nilai kekeruhan dan kecerahan dipengaruhi oleh padatan atau residu yang
tersuspensi (PJT1, 2015). TSS ditentukan dengan menghitung jumlah berat
lumpur kering dalam mg/l yang telah mengalami penyaringan dengan membran
berukuran 0,45 mikron dan dipanaskan dalam oven dengan suhu 105oC selama 1
jam. Penentuan zat padat tersuspensi (TSS) berguna untuk mengetahui kekuatan
pencemaran air limbah dan juga berguna untuk penentuan efisiensi unit
pengolahan air (Rachmawati dkk, 2005).
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
2.6 Matriks
Menurut Ruppert, et.al (2003) matriks adalah himpunan bilangan real yang
disusun secara persegi panjang, mempunyai m baris dan n kolom dengan bentuk
umum:
11 12 1
21 22 2
1 2
n
n
m m mn
c c cc c c
C
c c c
=
Tiap ijc yang berada didalam matriks C disebut elemen. Indeks i dan j masing –
masing menyatakan baris dan kolom tempat beradanya sebuah elemen dari
matriks C. Beberapa operasi pada matriks adalah sebagai berikut:
a. Penjumlahan
Jika dua matriks mempunyai ukuran yang sama, maka dapat dikatakan
konformal untuk penjumlahan. Hasil penjumlahan diperoleh dengan
menambahkan elemen yang sesuai. Oleh karena itu, jika A adalah matriks
berukuran n p× dan B adalah matriks berukuran n p× , kemudian C=A+B juga
adalah matriks berukuran n p× dan diperoleh ( ) ( )ij ij ijc a b= = +C . Hal ini juga
berlaku untuk perhitungan pengurangan antara dua konformal antara matriks A
dan B. jika A dan B adalah matriks berukuran n p× , maka dua sifat dari
penjumlahan matriks diberikan dalam teorema berikut:
(i) A+B=B+A
(ii) ( )T T T+ = +A B B A
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
b. Perkalian
Misalkan A adalah matrik berukuran m n× dan B adalah matriks berukuran
n p× . Hasil perkalian AB adalah matriks C berukuran m p× dengan
1
n
ij ir rjr
c=
=∑A B . Perkalian dua buah matriks A dan B dapat terjadi jika dan hanya
jika banyaknya kolom dari mayriks A sama dengan banyaknya baris dari matriks
B.
c. Transpose
Jika A adalah matriks berukuran m n× maka transpose dari notasi A
dinotasikan dengan TA didefinisikan sebagai matriks berukuran n m× yang
merupakan hasil pertukaran baris dan kolom matriks A salah satu sifat transpose
yang digunakan adalah ( )T T T=AB B A dengan syarat matriks A dan B masing –
masing merupakan matriks yang memenuhi sifat perkalian.
d. Invers
Misalkan A adalah matriks berukuran n n× (A adalah matriks persegi).
Sebuah matriks B berukuran n n× sedemikian hingga BA= I disebut invers kiri
dari A dan sebuah matriks B berukuran n n× sedemikian hingga AB= I disebut
invers kanan dari A dengan I merupakan matriks identitas. Jika AB=BA=I maka
matriks B disebut invers kanan dan invers kiri dari matriks A dan matriks A
dikatakan invertibel. Jika matriks A dan B masing – masing merupakan matriks
yang invertibel dan AB terdefinisi maka ( ) 1 1 1− − −=AB B A . Jika A adalah matriks
simetri dan nonsingular dan dipartisi menjadi 11 12
21 22
=
A AA
A Adan jika
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
122 21 11 12
−= −B A A A A , sedemikian hingga maka 111−A dan 1−B ada, sehingga
invers dari A adalah:
1 1 1 1 1 11 11 11 12 21 11 11 12
1 1 121 11
− − − − − −−
− − −
+ −=
A A A B A A A A BA
B A A B
e. Trace
Trace ( )ija=A berukuran n n× adalah fungsi matriks yang didefinisikan
sebagai jumlah dari elemen – elemen diagonal dari A, yaitu tr(A)=1
n
iii
a=∑ .
f. Matriks Partisi
Partisi dari matriks A menjadi empat submatriks (persegi atau persegi
panjang) dapat diindikasikan secara simbolis sebagai berikut:
11 12
21 22
=
A AA
A A
Jika dua matrik A dan B adalah konformal untuk perkalian, dan jika A dan B
dipartisi sehingga submatrik konformal, maka perkalian AB dapat dinyatakan
sebagai berikut.
11 12 11 12 11 11 12 21 11 12 12 22
21 22 21 22 21 11 22 21 21 12 22 22
+ + = = + +
A A B B A B A B A B A BAB
A A B B A B A B A B A B
Jika B diganti oleh vektor b yang dipartisi menjadi dua himpunan dari elemen –
elemen, jika A dipartisi menjadi dua himpunan dari kolom – kolom, maka
menjadi,
[ ] 11 2 1 1 2 2
2
,
= = +
bAb A A A b A b
b
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
g. Turunan Fungsi Vektor dan Matriks
Misalkan ( )v f x= merupakan fungsi dari variabel – variabel 1 2, , , px x x
dengan ( )1 2, , ,T
px x x x= , dan misalkan
1
2
p
vxv
v xx
vx
∂ ∂ ∂
∂ ∂= ∂ ∂ ∂
Misalkan T Tv = =c x x c , dengan 1 2( , , , )Tpc c c=c adalah vektor konstanta,
maka ( )( ) TTv
x x x∂∂ ∂
= = =∂ ∂ ∂
x cc x c , jika Tv = x Cx , dengan C adalah matriks simetri
dari suatu konstanta, 1
2
3
xxx
=
x dan 11 12 13
21 22 23
31 32 33
c c cc c cc c c
=
C maka
( )
( )
( )
( )
1
1
22
3
3
2 2
T
TT T
T
T
T
x
vx
x
∂
∂ ∂ ∂∂ = = = = ∂ ∂ ∂ ∂
∂
x Cx
c xx Cx x Cxc x Cx
x xc x
x Cx
h. Matriks Kovariansi
Varians 2 2 21 2, , , pσ σ σ dari 1 2, , , px x x dan kovariansi ijσ untuk semua
i j≠ merupakan elemen – elemen dari matriks kovariansi yang dinotasikan
dengan Σ yaitu:
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
11 12 1
21 22 2
1 2
cov( )
p
p
p p pp
x
σ σ σσ σ σ
σ σ σ
Σ = =
Baris ke- i dari Σ mengandung varians ix dan kovariansi ix dengan tiap variabel
x yang lain. Agar konsisten dengan notasi ijσ digunakan 2 , 1, 2, ,ii i i pσ σ= =
untuk varians. Varians terdapat pada diagonal Σ dan kovariansi berada pada
selain diagonal tersebut (Rencher & Schaaljee, 2008).
2.7 Regresi Nonparametrik
Regresi nonparametrik merupakan salah satu pendekatan dalam analisis
regresi yang digunakan apabila kurva regresinya tidak diasumsikan memiliki
bentuk tertentu. Dalam regresi nonparametrik, kurva regresi hanya diasumsikan
halus (smooth), sehingga pendekatan regresi nonparametrik memiliki fleksibilitas
yang tinggi karena data diharapkan mencari sendiri bentuk estimasi kurva regresi
tanpa dipengaruhi oleh faktor subyektivitas peneliti (Alfiani dkk, 2014).
Jika diberikan pasangan data ( , )i ix y dengan 1,2,...,i n= dan pola hubungan
antara variabel respon dengan variabel prediktor tidak diketahui bentuknya, maka
dapat digunakan pendekatan regresi nonparametrik. Secara umum, model regresi
nonparametrik adalah
( )i i iy f x ε= + , 1, 2,...,i n= (2.1)
dengan iy merupakan variabel respon, ( )if x adalah persamaan kurva regresi
yang tidak diasumsikan mengikuti bentuk tertentu dengan ix sebagai variabel
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
prediktor, sedangkan iε adalah error berdistribusi normal independen dengan
mean 0 dan variansi 2σ (Eubank, 1999). Terdapat beberapa teknik untuk
mengestimasi kurva regresi dalam regresi nonparametrik, diantaranya yaitu
regresi spline, kernel, deret fourier dan lain-lain.
2.8 Kuantil
Kuantil adalah nilai-nilai yang membagi suatu jajaran data menjadi bagian-
bagian yang sama. Menurut Walpole (1997), kuantil adalah nilai-nilai yang
dibawahnya terdapat sejumlah pecahan atau persentase tertentu dari seluruh
pengamatan. Beberapa kuantil yang sering dibahas diantaranya adalah persentil,
desil, dan kuartil.
a. Persentil
Nilai-nilai yang membagi segugus pengamatan menjadi 100 bagian yang
sama disebut persentil dan umumnya dinotasikan dengan 1 2 99, ,...,P P P . Notasi 1P
berarti bahwa 1% dari seluruh data terletak di bawah 1P , 2% terletak di bawah 2P
dan seterusnya sampai 99P yang menyatakan bahwa 99% terletak di bawah 99P .
b. Desil
Nilai-nilai yang membagi jajaran data menjadi 10 bagian yang sama
dinamakan desil. Nilai-nilai tersebut dinotasikan dengan 1 2 9, ,...,D D D yang
berarti bahwa 10% data terletak di bawah 1D , 20% terletak di bawah 2D , dan
seterusnya sampai 9D yang berarti bahwa 90% data terletak di bawah 9D .
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
c. Kuartil
Nilai-nilai yang membagi data menjadi 4 bagian yang sama disebut kuartil
dan dinotasikan dengan 1 2 3, ,Q Q Q . Notasi 1Q berarti bahwa 25% data terletak di
bawah 1Q , 50% data terletak di bawah 2Q , dan 75% data terletak di bawah 3Q .
Persentil ke-50, desil kelima, dan kuartil kedua dari suatu data disebut median.
Untuk menentukan kuantil data tak terkelompok, dapat digunakan prosedur
seperti dalam menentukan median. Sedangkan untuk data terkelompok, dapat
dengan rumus kuantil ke- i
( ),
Li
i Likuantil i
i n frK L c
f
− =
∑, dengan,
LiL = batas bawah nyata kelas dari kelas kuantil ke- i
n = banyaknya data (jumlah seluruh frekuensi)
r = konstanta (untuk kuartil 4r = , desil 10r = , persentil 100r = )
( )Lif∑ = jumlah frekuensi seluruh kelas yang lebih rendah daripada kelas
kuantil ke- i
,kuantil if = frekuensi kelas kuantil ke- i
c = lebar interval kelas kuantil (Harinaldi, 2005)
2.9 Estimator Spline Truncated
Salah satu pendekatan untuk mengestimasi fungsi ( )f x dalam regresi
nonparametrik adalah spline truncated. Spline truncated merupakan model
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
polinomial tersegmen yang memberikan fleksibilitas yang lebih baik daripada
polinomial biasa. Sifat tersegmen inilah yang memungkinkan model regresi spline
truncated menyesuaikan diri secara efektif terhadap karakteristik lokal dari data.
Secara umum, fungsi spline truncated berorde ( p ) dengan titik-titik knot
1 2, ,..., Mθ θ θ adalah sembarang fungsi yang dapat disajikan dalam bentuk sebagai
berikut:
0 1 1( ) ... ( )Mp p
p p m mmf x x x xβ β β β θ+ +=
= + + + + −∑ (2.2)
dengan ( ) pmx θ +− =
( ) ,0,
pm m
m
x xx
θ θθ
− ≥
< ; β adalah konstanta real (Eubank, 1999).
2.8.1 Estimasi Parameter Regresi Spline Truncated
Misalkan terdapat n pengamatan 1 , ni i ix y = yang memenuhi
persamaan (2.1) dengan ( )if x merupakan fungsi spline truncated yang
telah diuraikan pada persamaan (2.2). Dugaan fungsi kurva ( )f x dapat
diperoleh melalui estimasi koefisien
0 1 1 2( , ,..., , ,..., )Tp p p mβ β β β β β+ + +=
dengan 1 2( , ,..., )ny y y y=
dan
1 1 1 1 1
2 2 2 1 2
1
1 ( ) ( )1 ( ) ( )
1 ( ) ( )
p p pM
p p pM
p p pn n n n M
x x x xx x x x
X
x x x x
θ θθ θ
θ θ
+ +
+ +
+ +
− − − − =
− −
(2.3)
Nilai estimasi y
dapat diperoleh dengan menggunakan rumus sebagai
berikut: 1
ˆ ( )T Ty X X X X y A yλ− = =
(2.4)
dengan 1
( ) T TA X X X Xλ−
= ; λ merupakan parameter smoothing yaitu
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
orde ( )p , jumlah knot ( )M , dan titik knot ( 1 2, ,..., Mθ θ θ ), dapat dituliskan
dalam notasi 1 2( , , ( , ,..., ))Mp Mλ θ θ θ=
Apabila ingin mengestimasi kurva regresi nonparametrik dengan
pendekatan regresi spline truncated, maka secara teoritis dapat dilakukan
dengan mencari model spline terbaik berdasarkan orde dan titik knot
optimum yaitu banyaknya titik knot dan letak titik-titik knot (Sari, 2016).
2.8.2 Generalized Cross Validation (GCV)
Dalam analisis regresi nonparametrik dengan pendekatan spline
truncated perlu dilakukan pemilihan parameter smoothing optimum untuk
memperoleh pemodelan yang baik. Salah satu metode yang digunakan
sebagai kriteria untuk menentukan parameter smoothing optimum adalah
dengan menentukan nilai Generalized Cross Validation (GCV) yang
minimum. Menurut Wulandari dan Budiantara (2014) dalam Sari (2016),
secara teoritis kriteria GCV mempunyai sifat optimal asimtotik dan dapat
didefinisikan sebagai berikut:
( )2( )
1 ( )
MSEGCVtr I A
n
λλ
= −
(2.5)
dengan 1
( ) T TA X X X Xλ−
= , 21
1 ( )ni ii
MSE y yn =
= −∑ , I adalah matriks
identitas, dan n adalah jumlah pengamatan (Sari, 2016).
2.8.3 Pemilihan Titik Knot Optimal
Pemilihan jumlah dan titik knot optimal perlu dilakukan untuk
mengestimasi fungsi spline truncated. Jumlah knot ( )M merupakan
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
banyaknya titik knot atau banyaknya titik perubahan perilaku fungsi pada
interval yang berlainan. Ruppert (2002) dalam Sari (2016) menyatakan
bahwa titik knot terletak pada sampel kuantil dari nilai-nilai unique
(tunggal) variabel prediktor 1
ni i
x=
. Salah satu metode yang dapat
digunakan untuk menentukan jumlah dan lokasi titik knot optimal adalah
metode full-search. Algoritma dari metode full-search yang didasarkan pada
kriteria Generalized Cross Validation (GCV) adalah:
a. Membandingkan nilai ( )GCV λ pada 1M = dan 2M = .
i. Apabila nilai ( )GCV λ pada 1M = lebih kecil dari nilai ( )GCV λ
pada 2M = , maka algoritma berhenti dengan memilih jumlah knot
optimal yaitu 1M = .
ii. Apabila nilai ( )GCV λ pada 1M = lebih besar dari nilai
( )GCV λ pada 2M = , maka algoritma ini akan dilanjutkan
dengan membandingkan nilai ( )GCV λ untuk 2M = dan 3M = .
b. Membandingkan nilai ( )GCV λ pada 2M = dan 3M = .
i. Apabila nilai ( )GCV λ pada 2M = lebih kecil dari nilai
( )GCV λ pada 3M = , maka algoritma berhenti dengan memilih
jumlah knot optimal yaitu 2M = .
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
ii. Apabila nilai ( )GCV λ pada 2M = lebih besar dari nilai
( )GCV λ pada 3M = , maka algoritma ini akan dilanjutkan
dengan membandingkan nilai ( )GCV λ untuk 3M = dan 4M = .
c. Membandingkan nilai ( )GCV λ pada 3M = dan 4M = yang
dilakukan dengan cara yang sama seperti di atas, demikian seterusnya
hingga diperoleh nilai ( )GCV λ yang minimum.
2.10 Data Longitudinal
Data longitudinal merupakan data yang diperoleh dari pengamatan yang
dilakukan secara berulang dari waktu ke waktu pada satu unit eksperimen. Pada
data cross sectional setiap obyek hanya diamati satu kali (Wu & Zhang, 2006).
Berbeda dengan data time series, data longitudinal mengobservasi beberapa obyek
yang saling independen. Dengan demikian, data longitudinal juga dikenal sebagai
gabungan antara data cross sectional dan time series (Frees, 2003). Cakupan
pengertian serta karakteristik dari penelitian yang melibatkan data longitudinal
adalah sebagai berikut:
a. Data dikumpulkan untuk setiap obyek dan setiap variabel pada dua atau
lebih periode waktu tertentu.
b. Kasus atau subyek yang dianalisis sama atau setidaknya dapat
diperbandingkan antara satu periode dengan periode berikutnya.
c. Analisis melibatkan perbandingan data dari kasus yang sama dalam satu
periode.
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
Struktur data longitudinal dapat diuraikan dalam Tabel 2.1 sebagai berikut:
Tabel 2.1 Struktur Data Longitudinal
Subyek Pengamatan Respon Prediktor
11
122
2
ss
s
1
2
12
12
12
s
t
t
t
1
2
11
12
1
21
22
2
1
2
s
t
t
s
s
st
yy
y
yy
y
yy
y
1
2
11
12
1
21
22
2
1
2
s
t
t
s
s
st
xx
x
xx
x
xx
x
dengan 1,2,...,i s= merupakan banyaknya unit eksperimen dan 1,2,..., ij t=
merupakan banyaknya pengamatan yang dilakukan pada setiap unit eksperimen
sehingga total pengamatan adalah 1
s
ii
t=∑ (Sari, 2016).
2.11 Homoskedastisitas dan Heteroskedastisitas
Salah satu asumsi dalam analisis regresi adalah homoskedastisitas yang
berarti bahwa variansi dari setiap iε tidak tergantung pada variabel pediktor.
Variansi dari setiap iε bernilai sama untuk semua variabel pediktor, sehingga
nilai dari variansi residual bersifat konstan atau ( ) ( )2 2i iVar Eε ε σ= = ,
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
1,2,...,i s= . Pelanggaran terhadap asumsi ini disebut heteroskedastisitas yang
berarti bahwa variansi dari setiap error bersifat tidak konstan. Dalam analisis
regresi, heteroskedastisitas dinyatakan sebagai berikut:
( ) 2i i iVar xε σ= , 1, 2,...,i s= (2.6)
Persamaan (2.6) juga dapat dinotasikan dalam model di bawah ini.
21 1
222 2 2
2
0 0 0 00 0 0 0
0 0 0 0 0 0
T
n n
E
ω σω σ
εε σ σ
ω σ
= Ω = =
X
sehingga 2 2i iσ σ ω= . Dalam kasus homokedastisitas, nilai 1iω = untuk
1,2,...,i s= (Sari, 2016).
2.12 Uji Box’s M
Salah satu metode yang digunakan untuk mendeteksi adanya kasus
heteroskedastisitas adalah uji Box M. Uji Box M adalah uji statistika yang
digunakan untuk menguji heteroskedastisitas suatu kovarians matriks, dengan
subjek ke-i pengamatan ke-j dan dinyatakan dalam model regresi Tij ij ijy x β ε= +
dengan 1,2, ,i s= ; 1, 2, , ij t= . Hipotesis yang digunakan dalam pengujian ini
adalah:
H0 : 21 2( ) ( ) ( ) ; 1, 2, ,iVar Var Var i sε ε ε σ= = = = =
H1 : minimal ada satu ( ) 2iVar ε σ≠
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
Statistik Uji Box M adalah sebagai berikut :
( )1
log ( 1) log ; 0s
i ii
N T s S t S S=
= − − − ≥∑ (2.7)
1
s
ii
T t=
=∑ , untuk ( )( )1
1si i
i
t SS
T s=
−=
−∑ ; dan ( )( )
( )1 1
isij ij i ij i
ij i
w y y y yS
t=
− −=
−∑
dengan :
s : jumlah subjek yang diamati
ti : jumlah pengamatan dalam setiap subjek ke-i
T : jumlah dari ti
ijW : matriks pembobot (Box, 1949)
Untuk menguji signifikansi nilai N yang telah diperoleh, maka digunakan
uji Chi-Square dan uji F. untuk Uji F dengan daerah ( )1 21 , ,CDF N f fγ− adalah
F Nγ= (2.8)
dengan 11
2
f ff
ργ −
=
, ( )( ) ( ) ( )
2
2 21
2 3 1 1 116 1 1 1
k
i i
r rr g n n k
ρ=
+ −= − −
+ − − −∑ ;
( ) ( )1
1 12
g r rf
− += ;
( )1
2 2
21
ffτ ρ
+=
− −; ( )( )
( ) ( ) ( )2 21
1 2 1 16 1 1
k
i i
r rk n N k
τ=
− += −
− − − ∑
(Sari, 2016)
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
2.13 Uji Korelasi Pearson
Koefisien korelasi merupakan suatu nilai yang mengukur keeratan
hubungan antara dua variabel. Koefisien korelasi yang dihitung untuk data
populasi dinotasikan dengan ρ sedangkan koefisien korelasi yang dihitung untuk
data sampel dinotasikan dengan r . Nilai koefisien korelasi dapat dihitung dengan
menggunakan Pearson Product Moment pada persamaan (2.9) sebagai berikut:
( ) ( )( )
( )( ) ( )( )2 22 2
ij ij ijij
ij ij ij ij
n X Y X Yr
n X X n Y Y
−=
− −
∑ ∑ ∑
∑ ∑ ∑ ∑
(2.9) nilai r selalu berada diantara -1 sampai 1 ( )1 1r− ≤ ≤ . Apabila nilai
1r = maka disebut dengan korelasi linier positif sempurna. Apabila nilai 1r = −
maka dinamakan korelasi linier negatif sempurna, sedangkan apabila nilai 0r =
menunjukkan bahwa tidak terdapat korelasi diantara kedua variabel tersebut.
Pengujian koefisien korelasi dilakukan dengan menggunakan hipotesis,
yaitu
0H : 0ρ = (kedua variabel tidak memiliki hubungan linier)
1H : 0ρ > , 0ρ < atau 0ρ ≠
Konversi nilai koefisien korelasi menjadi distribusi t adalah
2
21
r ntr−
=−
(2.10)
dengan derajat bebas 2,n n− merupakan banyaknya pasangan data dari variabel-
variabel yang diduga berkorelasi dan r merupakan nilai koefisien korelasi yang
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
diperoleh berdasarkan persamaan (2.10). Nilai statistik uji t yang telah diperoleh
berdasarkan persamaan (2.10) selanjutnya dibandingkan dengan nilai t tabel.
Apabila nilai t hitung kurang dari t tabel maka 0H diterima sehingga dapat
disimpulkan bahwa tidak terdapat korelasi linier diantara kedua variabel,
demikian sebaliknya. (Brase dan Corrinne, 2013)
2.14 Regresi Nonparametrik Birespon Spline Truncated
Analisis regresi yang melibatkan dua variabel respon dan diantara variabel
respon tersebut terdapat korelasi atau hubungan yang kuat, baik secara logika
maupun matematis disebut regresi birespon. Apabila bentuk kurva regresi
birespon tidak diketahui, maka pendekatan yang digunakan adalah pendekatan
nonparametrik sehingga disebut regresi nonparametrik bi-response. Secara umum,
model untuk regresi nonparametrik birespon dapat dituliskan sebagai berikut:
( )i i iy f x ε= +
(2.11)
dengan ( ) ( )( )1 2 T
i i iy y y=
; ( ) ( )( )1 2( ) ( ) ( )T
i i if x f x f x=
dan ( ) ( )( )1 2 T
i i iε ε ε=
merupakan error random dengan mean 0 dan variansi i∑ , 1, 2,...,i s=
menyatakan indeks untuk subyek yang diamati. Fungsi f adalah kurva regresi
yang tidak diketahui bentuknya dan dapat dihampiri dengan fungsi spline
truncated sebagai berikut:
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
( ) ( ) ( ) ( ) ( ) ( ) ( )( )01 1 1
r r r
r
p p M pr r r r r rs si s i s i p m i m
s s mf x x x xβ β β β θ+
+= = =
= + + + −∑ ∑ ∑ (2.12)
dengan ( ) ( ) ( ) ( ) ( ) ( ) ( )( )0 1 1 2r r r r
Tr r r r r r rp p p p mβ β β β β β β+ + +=
merupakan
parameter variabel respon ke r (Wulandari dkk, 2014).
2.15 Weighted Least Square
Untuk mengilustrasikan metode Weighted Least Square (WLS), digunakan
model dua variabel regresi linier. Metode kuadrat terkecil tanpa pembobot yaitu
Ordinary Least Square (OLS) meminimumkan sedangkan metode WLS
meminimumkan jumlah kuadrat eror terboboti yang dirumuskan sebagai berikut
( ) ( )=TT y yε ε β β− −W X W X
(2.13) dengan
β
merupakan estimator WLS dan pembobot W merupakan invers dari matriks
variansi-kovariansi dari ε
atau y
dengan syarat X , yang dinotasikan dengan
( ) ( )Var Var yε = = ΣX X
.
Persamaan (2.13) selanjutnya diturunkan terhadap β
sedemikian sehingga
diperoleh estimator WLS sebagai berikut:
( ) 1ˆ yT Tβ−
= X WX X W
(2.14)
Pada metode OLS, pembobot W merupakan matriks identitas (Farebrother,
1988).
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
2.16 Regresi Nonparametrik Birespon pada Data Longitudinal Berdasarkan
Estimator Weighted Spline Truncated
Sari (2016) menyatakan persamaan regresi nonparametrik birespon pada
data longitudinal diasumsikan data berpasangan ( ) ( )( )1 2, ,ij ij ijx y y dan memenuhi
persamaan sebagai berikut:
( )ij ij ijy f x ε= +
(2.15)
dengan, ( ) ( ) ( ) ( ) ( )( )1 2 T
ij ij ijf x f x f x=
dan ( ) ( )( )1 2ij ij ijε ε ε= merupakan error
random dengan mean 0 dan variansi i∑ , 1, 2,...,i s= menyatakan indeks untuk
subyek yang diamati dan 1,2,..., ij t= menyatakan indeks untuk pengamatan di
setiap subyek.
Regresi nonparametrik birespon pada data longitudinal berdasarkan
estimator weighted spline truncated sebagai berikut:
ˆy β= X
( ) 1yT T−
= X X WX X W
= yA
(2.16)
dengan ( ) 1= T T−
A X X WX X W merupakan matriks yang berukuran 2 2T T× .
Berdasarkan rumus Mean Square Error (MSE) yaitu
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
( ) ( ) ( )1 ˆ ˆ2T
MSE T y y y y− = − −
(2.17)
selanjutnya dapat diturunkan rumus MSE dalam regresi nonparametrik birespon
pada data longitudinal dan diperoleh rumus MSE sebagai berikut:
( ) ( )12
TTMSE y yT
= − −I A I A
(2.18)
nilai MSE tersebut kemudian digunakan untuk menghitung nilai Generalized
Cross Validation (GCV). Kriteria nilai GCV yang minimum digunakan untuk
menentukan jumlah knot yang optimum. Berdasarkan rumus umum GCV yang
terdapat pada persamaan (2.5), maka nilai GCV dalam regresi nonparametrik
birespon pada data longitudinal dirumuskan pada persamaan sebagai berikut:
( )( ) ( )
( )
1
21
2
2
TTT y yGCV
T trλ
−
−
− −=
−
I A I A
I A
(2.19)
dengan ( ) 1= T T−
A X WX X W ; λ merupakan parameter smoothing yaitu orde ( )rp
, jumlah knot ( )M , dan titik knot ( )1 2, ,..., Mθ θ θ atau dapat dituliskan dalam notasi
( )( )1 2, , , ,...,r Mp Mλ θ θ θ= .
Selanjutnya dilakukan uji kesesuaian model dengan menghitung kriteria
Goodness of Fit yaitu MSE dan 2R dengan
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
2 1 JKGRJKT
= − (2.20)
Jumlah Kuadrat Galat (JKG) ( ) ( )ˆ ˆT
y y y y= − −
dan Jumlah Kuadrat Total (JKT)
( ) ( )Ty y y y= − −
.
2.17 Open Source Software (OSS)-R
R merupakan salah satu software yang sering digunakan dalam statistika
dan termasuk dalam kategori Open Source Software (OSS) sehingga dapat
diperoleh secara gratis di situs http://www.r-project.org/ atau http://cran.r-
project.org/. Versi pertama R diluncurkan pada tahun 1992 oleh Ross Ihaka dan
Robert Gentleman (singkatan R berasal dari kedua nama tersebut) yang keduanya
dari The University of Auckland. Bahasa R berbasis bahasa S yang dibangun di
Bell Laboratories di tahun 80-an sehingga syntax R memiliki perbedaan yang
tidak terlalu banyak atau hampir identik jika dibandingkan dengan syntax pada
software S-plus (Sari, 2016).
Beberapa perintah internal yang digunakan dalam OSS-R adalah sebagai
berikut:
1. function( ), merupakan perintah untuk menunjukkan kumpulan dari
beberapa fungsi yang digunakan dalam program. Fungsi dipanggil
dengan format nama fungsi( daftar argumen ).
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
2. length( ), merupakan perintah yang digunakan untuk menghitung
banyaknya data. Misalkan terdapat perintah length(vector), maka akan
diperoleh hasil yaitu panjang dari vector tersebut.
3. plot( ), digunakan untuk membuat plot data. Beberapa penggunaan
perintah ini diantaranya:
a. plot(X,Y) berarti bahwa akan dibuat plot data berupa titik dengan
sumbu datar X dan sumbu tegak Y.
b. plot(X,Y,type=”l”) memberikan hasil plot bertipe garis.
c. plot(X,Y,type=”b”) memberikan hasil plot bertipe garis dan titik.
4. rep(a,b), merupakan perintah yang digunakan untuk membentuk suatu
vektor dengan anggota a sebanyak b.
5. matrix(a,b,c), merupakan perintah yang digunakan untuk membentuk
suatu matriks berukuran b×c dengan elemen a.
6. print( ), digunakan untuk menampilkan hasil atau output dari program.
7. cat(“…”), merupakan perintah untuk menuliskan kemudian
menampilkan argumen dalam bentuk karakter.
8. for( ), merupakan perintah yang digunakan untuk mengulang satu blok
pernyataan berulang kali hingga memenuhi kondisi yang telah
ditentukan. Format penulisan perintah ini adalah for( kondisi )
pernyataan .
9. repeat( ), hampir mirip dengan for( ), apabila kondisi sudah terpenuhi
maka proses pengulangan akan dihentikan. Struktur penulisan
statement repeat dalam R yaitu repeat command if( kondisi ) break
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
10. if-else, merupakan perintah yang digunakan untuk seleksi kondisi.
Apabila suatu kondisi bernilai benar, maka pernyataan pertama akan
dijalankan, sedangkan apabila kondisi bernilai salah maka pernyataan
kedua yang akan dijalankan. Struktur penulisan perintah ini adalah
sebagai berikut: if( kondisi ) pernyataan pertama else pernyataan
kedua
11. solve( A ), digunakan untuk menghitung invers dari suatu matriks A.
12. sum( ), digunakan untuk menghitung jumlah dari keseluruhan data.
13. rbind( ), digunakan untuk menggabungkan suatu matriks atau vektor
berdasarkan baris.
14. cbind( ), digunakan untuk menggabungkan suatu matriks atau vektor
berdasarkan kolom.
15. diag( a ), merupakan perintah yang digunakan untuk membentuk suatu
vektor a menjadi suatu matriks diagonal dengan elemen diagonal
utamanya adalah elemen dari a dan elemen yang lain bernilai nol.
16. sort( ), merupakan perintah yang digunakna untuk mengurutkan
sekumpulan data.
17. unique( ), digunakan untuk menentukan nilai tunggal dari suatu data.
18. quantile(…, …), merupakan perintah untuk menentukan sampel
kuantil.
19. order( ), merupakan perintah untuk menunjukkan vektor posisi data
apabila data tersebut diurutkan.
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
20. var( ), merupakan perintah untuk menghitung nilai variansi dari suatu
vektor atau matriks variansi-kovariansi dari suatu matriks.
21. boxM(data, kelompok), merupakan syntax uji Box’s M yang
digunakan untuk menguji homogenitas matriks variansi-kovariansi
yang diperoleh dari data yang berdistribusi normal multivariate
berdasarkan satu klasifikasi.
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
BAB III
METODOLOGI PENELITIAN
3.1 Data dan Sumber Data
Data yang digunakan dalam skripsi ini adalah data sekunder yang berasal
dari pemantauan kualitas 18 titik WS Brantas (tanpa hilir) di sekitar lokasi industri
yang ditentukan berdasarkan lokasi pembuangannya dan jenis limbah yang
memberikan kontribusi adanya pencemaran dalam 3 triwulan yaitu bulan April-
Juni, Juli-September, dan Oktober-Desember 2015 yang dilakukan oleh Perum
Jasa Tirta 1 (PJT 1).
Titik pengambilan sampel limbah pada WS Brantas di dekitar lokasi industri
disajikan pada Tabel 3.1
Tabel 3.1. Daftar Industri Titik Pengambilan Sampel Limbah
No. Nama Industri Daerah
1 Dinas Pemotongan Hewan Malang Kota Malang
2 PT. Pindad Kabupaten Malang
3 PT. Eka Mas Fortuna Kabupaten Malang
4 Peternakan Babi Sempulur Kabupaten Malang
5 Peternakan Babi Delta Kabupaten Malang
6 CV. Sartimbul Kabupaten Tulungagung
7 Peternakan Babi Hanjoyo Kabupaten Tulungagung
8 PT. Setia Kawan Kabupaten Tulungagung
9 PT. Surya Zig Zag Kabupaten Kediri
10 PT. Surya Pamenang Kabupaten Kediri
11 UD. Sumberejo Kabupaten Kediri
12 PT. Jaya Kertas Kabupaten Nganjuk
13 PT. Cheil Jedang Kabupaten Jombang
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
No. Nama Industri Daerah
14 PT. Ajinomoto Indonesia Kabupaten Mojokerto
15 PT. Darmala Kabupaten Mojokerto
16 PT. Pakerin Kabupaten Mojokerto
17 PT. Sateliti Sriti Kabupaten Pasuruan
18 PT. Tjiwi Kimia Kabupaten Sidoarjo
3.2 Variabel Penelitian
Variabel-vaiabel penelitian yang digunakan dalam skripsi ini disajikan
dalam Tabel 3.2.
Tabel 3.2 Variabel-varibel Penelitian
Variabel Keterangan Variabel Satuan Tipe Variabel
ijx Kadar TSS pada subjek ke-
i, pengamatan ke-j gr/l Kontinu
(1)ijy
Kadar BOD pada subjek ke-
i, pengamatan ke-j gr/l Kontinu
(2)ijy
Kadar COD pada subjek ke-
i, pengamatan ke-j gr/l Kontinu
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
3.3 Langkah Analisis
Langkah analisis yang dilakukan untuk menjawab rumusan masalah dalam
skripsi ini adalah sebagai berikut:
1. Mengestimasi model BOD dan COD sebagai parameter kualitas air sungai
Brantas di sekitar lokasi industri dengan pendekatan regresi nonparametrik
birespon pada data longitudinal berdasarkan estimator spline truncated
menggunakan aplikasi OSS-R dengan langkah-langkah sebagai berikut:
a. Membuat plot antara BOD dengan TSS dan COD dengan TSS.
b. Menginputkan data berpasangan (TSS, BOD, dan COD) yang
memenuhi persamaan (2.15).
c. Menguji korelasi antara variabel BOD dan COD dengan
menggunakan persamaan (2.10)
d. Menentukan parameter smoothing optimum dengan melakukan
estimasi tanpa pembobot W menggunakan metode full-search
berdasarkan kriteria GCV minimum seperti yang telah dijelaskan pada
subbab (2.8.3)
e. Menguji heteroskedastisitas pada error dengan menggunakan uji
Box’s M pada subbab (2.12)
f. Menentukan matriks pembobot W berdasarkan hasil uji
heteroskedastisitas.
g. Menentukan parameter smoothing optimum dengan melibatkan
pembobot W menggunakan metode full-search berdasarkan kriteria
GCV minimum seperti yang telah dijelaskan pada subbab (2.8.3)
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
h. Mengestimasi data dengan menggunakan estimator weighted spline
truncated sehingga diperoleh data berpasangan untuk setiap subyek
pengamatan ke- i , ( )1,2,...,i s= sebanyak it pengamatan yang
memenuhi persamaan (2.15)
i. Menghitung nilai kriteria Goodness of Fit yaitu MSE dan R-square
berdasarkan persamaan (2.17) dan (2.20)
2. Menganalisis dan menginterpretasi hasil estimasi model BOD dan COD
sebagai parameter kualitas air sungai Brantas di sekitar lokasi industri
dengan pendekatan regresi nonparametrik birespon pada data longitudinal
berdasarkan estimator spline truncated.
a. Menganalisis hasil estimasi model BOD dan COD sebagai parameter
kualitas air sungai Brantas di sekitar lokasi industri dengan pendekatan
regresi nonparametrik birespon pada data longitudinal berdasarkan
estimator spline truncated.
b. Menginterpretasi hasil estimasi model BOD dan COD sebagai parameter
kualitas air sungai Brantas di sekitar lokasi industri dengan pendekatan
regresi nonparametrik birespon pada data longitudinal berdasarkan
estimator spline truncated dan membuat plot antara nilai estimasi dan
observasi BOD dengan TSS dan COD dengan TSS.
Berikut disajikan flowchart dari analisis model regresi nonparametrik
birespon pada data longitudinal berdasarkan estimator spline truncated:
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
Tidak dapat digunakan
analisis regresi birespon
Selesai
Mulai
Input data
Input alfa
Uji korelasi antara dan
p-value ≤ alfa
Input n
• Matriks p, vektor jp.
•
xbaru
C=1
B A
Ya
Tidak
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
B A
Vektor MSE; vektor GCV;
dan
dan
Jumlah titik knot optimum untuk orde adalah
Membandingkan untuk kombinasi orde
C
Ya
Tidak
Ya
Tidak
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
C
Melakukan estimasi dengan menggunakan parameter smoothing optimal yang telah diperoleh
Uji heteroskedastisitas pada nilai
p-value ≤ alfa
Menghitung variansi-
kovariansi dari dan
Menghitung variansi-
kovariansi dari dan
Mereplikasi setiap elemen dari matriks variansi-
kovariansi sebanyak
Mereplikasi setiap elemen dari matriks variansi-
kovariansi sebanyak
Mendefinisikan hasil dari suatu vektor
Menggabungkan hasil replikasi dalam suatu vektor
Mendefinisikan vektor replikasi sebagai matriks
D
Ya Tidak
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
D
Menggabungkan keempat matriks diagonal, dan menghitung inversnya
Menentukan parameter smoothing optimum dengan menyertakan pembobot W
Melakukan estimasi dengan dengan menggunakan parameter smoothing optimal yang telah diperoleh beserta
Melakukan nilai dan estimasi
Menghitung MSE dan
Membuat plot estimasi
Selesai
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
BAB IV
HASIL DAN PEMBAHASAN
Bab ini berisi pembahasan hasil analisis untuk menjawab tujuan skripsi
yang meliputi estimasi model BOD dan COD dengan pendekatan regresi
nonparametrik birespon pada data longitudinal berdasarkan estimator spline
truncated serta analisis dan interpretasi model.
4.1 Estimasi Model BOD dan COD dengan Pendekatan Regresi
Nonparametrik Birespon pada Data Longitudinal Berdasarkan
Estimator Spline Truncated
Data yang digunakan dalam estimasi model regresi nonparametrik birespon
pada data longitudinal berdasarkan estimator spline truncated adalah data hasil
pengamatan BOD, COD, dan TSS di titik-titik WS Brantas di sekitar lokasi
industri pada bulan April-Juni, Juli-September, dan Oktober-Desember tahun
2015. Variabel yang digunakan diantaranya BOD sebagai variabel respon 1, COD
sebagai variabel respon 2 dan TSS sebagai variabel prediktor. Data tersebut dapat
dilihat secara lengkap pada Lampiran 1
Gambaran awal tentang hubungan data BOD dengan TSS dan COD dengan
TSS dapat dilakukan dengan membuat plot yang dapat dilihat pada Gambar 4.1
dan Gambar 4.2 sebagai berikut:
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
Gambar 4.1 Plot Data Pengamatan BOD terhadap TSS
Gambar 4.2 Plot Data Pengamatan COD terhadap TSS
Pada Gambar 4.1 dan Gambar 4.2 dapat dilihat pola data BOD dan COD
terhadap TSS tidak beraturan dan pola data tidak dapat diasumsikan mendekati
suatu fungsi tertentu (linier, kuadratik, kubik, dsb).
BOD dan COD memiliki korelasi atau keeratan hubungan baik secara logika
maupun secara matematis yang ditunjukkan dengan uji korelasi pearson.
Hipotesis uji korelasi pearson adalah sebagai berikut:
0
0,5
1
1,5
0 0,5 1 1,5 2
BO
D (g
r/l)
TSS (gr/l)
plot observasi
0
2
4
6
8
10
0 0,5 1 1,5 2
CO
D (g
r/l)
TSS (gr/l)
plot observasi
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
H0 : Tidak terdapat korelasi diantara BOD dan COD ( )0ρ =
H1 : Terdapat korelasi diantara BOD dan COD ( )0ρ ≠
Dari hasil uji korelasi pearson yang terdapat pada Lampiran 3 diperoleh nilai
koefisien korelasi antara variabel BOD dan COD sebesar 0,601 dengan nilai p-
value 1,532×10-6. Nilai p-value tersebut kurang dari α bernilai 0,05 sehingga
diperoleh keputusan untuk menolak H0. Dengan demikian diperoleh kesimpulan
bahwa terdapat korelasi antara variabel BOD dan COD sehingga dapat diestimasi
dengan pendekatan regresi birespon.
Analisis data BOD dan COD dengan menggunakan program estimasi tanpa
pembobot W yang telah dibuat menggunakan OSS-R yang telah terlampir pada
Lampiran 2 diperoleh hasil yang ditampilkan dalam Tabel 4.1 berikut,
Tabel 4.1 Pemilihan Orde Optimum Berdasarkan Jumlah Knot Optimum
pada Data BOD dan COD (Tanpa Pembobot)
Orde Respon 1
Orde Respon 2
Jumlah Titik Knot Optimum
Titik Knot GCV
1 1 1 0,04995 0,2779269
1 2 3 0,019225; 0,04995; 0,16375
0,1860923
2 1 1 0,04995 0,2743006
2 2 3 0,019225; 0,04995; 0,16375
0,1840114
Pada Tabel 4.1 dapat dilihat bahwa GCV minimum adalah 0,1840114 sehingga
parameter smoothing optimum yaitu orde respon 1 adalah 2, dan orde respon 2
adalah 2 dengan 3 titik knot yaitu 0,019225; 0,04995; dan 0,16375.
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
Setelah diperoleh perameter smoothing optimum, selanjutnya dilakukan
estimasi dengan menggunakan parameter smoothing optimum tersebut sehingga
diperoleh nilai ε
untuk respon 1 dan respon 2. Pengujian heteroskedastisitas
variansi error perlu dilakukan untuk menentukan matriks pembobot W . Dalam
hal ini, uji heteroskedastisitas dilakukan dengan menggunakan uji Box’s M
dengan hipotesis sebagai berikut:
H0 : 1 2 18...Σ = Σ = = Σ .
H1 : Minimal ada sepasang iΣ yang tidak sama ( )1,2,...,18i =
Berdasarkan hasil uji Box’s M yang terdapat pada Lampiran 3 diperoleh nilai p-
value untuk variansi eror data BOD dan COD adalah 9,259×10-15. Nilai p-value
tersebut kurang dari α bernilai 0,05 sehingga diperoleh keputusan untuk menolah
H0. Dengan demikian diperoleh kesimpulan terdapat kasus heterokedastisitas pada
data BOD dan COD.
Pemilihan parameter smoothing optimum perlu dilakukan ulang dengan
disertai pembobot W karena terdapat kemugkinan bahwa parameter smoothing
optimum yang diperoleh akan berbeda antara sebelum dan setelah ada matriks
pembobot W . Berdasarkan analisis data BOD dan COD dengan menggunakan
program estimasi yang menyertakan pembobot W yang terlampir pada Lampiran
2, diperoleh parameter smoothing dengan menggunakan kombinasi orde dan titik
knot yang terdapat pada Lampiran 3. Pemilihan parameter smoothing optimum
dengan menyertakan matriks pembobot W untuk data BOD dan COD
ditampilkan dalam Tabel 4.2 berikut:
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
Tabel 4.2 Pemilihan Orde Optimum Berdasarkan Jumlah Knot Optimum
pada Data BOD dan COD (Dengan Pembobot)
Orde Respon 1
Orde Respon 2
Jumlah Titik Knot Optimum Titik Knot GCV
1 1 1 0,04995 0,3481324
1 2 5
0,01135; 0,022433; 0,04995; 0,1096; 0,26
0,1929118
2 1 4 0,01382; 0,04336; 0,0752; 0,1806
0,3369376
2 2 3 0,019225; 0,04995; 0,16375
0,1979677
dari Tabel 4.2 dapat dilihat bahwa nilai GCV sebelum dan setelah disertakan
pembobot berbeda. Pada tabel tersebut dapat dilihat bahwa nilai GCV minimum
adalah 0,1929118 sehingga parameter smoothing optimum yaitu orde respon 1
adalah 1, dan orde respon 2 adalah 2, dengan 5 titik knot optimum, yaitu 0,01135;
0,022433; 0,04995; 0,1096; 0,26.
4.2 Menganalisis dan Menginterpretasi Hasil Estimasi Model BOD dan
COD dengan Pendekatan Regresi Nonparametrik Birespon pada Data
Longitudinal Berdasarkan Estimator Weighted Spline Truncated
Berdasarkan Tabel 4.1 dan Tabel 4.2, diperoleh estimasi model BOD adalah
sebagai berikut:
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
( ) ( ) ( ) ( )1ˆ 0,00597 0,215 1,633 0,01135 1,048 0,022433 1,215 0,04995y x x x x+ + +
= − + − + − − − +
( ) ( )1,189 0,1096 2,19 0,26x x+ +
− − − (4.1)
dengan
( )0,01135 untuk 0,01135
0,011350 untuk 0,01135
x xx
x+
− ≥− = <
;
( )0,022433 untuk 0,022433
0,0224330 untuk 0,022433
x xx
x+
− ≥− = <
;
( )0,04995 untuk 0,04995
0.049950 untuk 0,04995
x xx
x+
− ≥− = <
;
( )109,6 untuk 0,1096
0,10960 untuk 0,1096
x xx
x+
− ≥− = <
; dan
( )0,26 untuk 0,26
0,260 untuk 0,26
x xx
x+
− ≥− = <
sehingga persamaan (4.1) dapat diuraikan menjadi fungsi potongan sebagai
berikut:
( )1
0,00597 0,215 ;untuk 0,011350,013 1,418 ;untuk 0,01135 0,0224330,037 2,466 ;untuk 0,022433 0,04995
ˆ0,024 1,251 ;untuk 0,04995 0,1096
0,082 2,44 ;untuk 0,1096 0,260,487 0,25 ;untuk 0,2
x xx xx x
yx x
x xx x
− <− + ≤ <− + ≤ <
=+ ≤ <
− + ≤ <+ ≥ 6
(4.2)
Dari persamaan (4.2), diketahui bahwa perubahan nilai BOD tertinggi di 18 titik
WS Brantas di sekitar lokasi industri adalah ketika nilai TSS 0,022 gr/l sampai
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
nilai TSS kurang dari 0,04995 gr/l, yaitu setiap kenaikan nilai TSS 1 gr/l, maka
kenaikkan BOD sebesar 2,466 gr/l. Sedangkan perubahan nilai BOD terendah di
18 titik sungai tersebut adalah ketika nilai TSS kurang dari 0,01135 gr/l, yaitu
setiap kenaikkan nilai TSS 1 gr/l, maka nilai BOD mengalami penurunan sebesar
0.215 gr/l. Selain itu, dari persamaan (4.2) dapat diketahu estimasi nilai BOD di
18 titik sungai tersebut pada nilai TSS tertentu. Misalkan nilai TSS 0,3 gr/l,
dengan menggunakan persamaan (4.2) pada interval nilai 0, 26x ≥ dapat
diketahui nilai estimasi BOD yaitu sebesar 0,562 gr/l.
Berdasarkan Tabel 4.2, estimasi model BOD adalah:
( ) ( ) ( )2 22 2ˆ 0,034 5,004 326,922 372,022 0,01135 266,964 0,022433y x x x x+ +
= − + − − + − −
( ) ( ) ( )2 2 2302,603 0,04995 63,454 0,1096 21,447 0,26x x x+ + +
− + − + − (4.3)
Dengan
( )2 0,01135 untuk 0,011350,01135
0 untuk 0,01135x x
xx+
− ≥− = <
;
( )2 0,022433 untuk 0,0224330,022433
0 untuk 0,022433x x
xx+
− ≥− = <
;
( )2 0,04995 untuk 0,049950.04995
0 untuk 0,04995x x
xx+
− ≥− = <
;
( )2 109,6 untuk 0,10960,1096
0 untuk 0,1096x x
xx+
− ≥− = <
; dan
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
( )2 0, 26 untuk 0,260,26
0 untuk 0,26x x
xx+
− ≥− = <
sehingga persamaan (4.3) dapat diuraikan menjadi fungsi potongan sebagai
berikut:
( )
2
2
22
2
0,034 5,004 326,922 ;untuk 0,011350,082 13,56 698,944 ;untuk 0,01135 0,022433
0,216 25,538 965,908 ;untuk 0,022433 0,04995ˆ0,971 55,768 1268,511 ;untuk 0,04995 0,1096
1,732 69,664 13
x x xx x xx x x
yx x x
x
− + <− + ≤ <− + ≤ <
=− + ≤ <− + 2
2
31,965 ;untuk 0,1096 0, 263,182 80,816 1353,412 ;untuk 0,26
x xx x x
≤ <
− + ≥
(4.4)
Berdasarkan persamaan (4.4), untuk menduga nilai COD misalkan ketika nilai
TSS 0,01 gr/l dengan menggunakan persamaan (4.4) pada interval nilai 0,011x <
dapat diketahui nilai estimasi COD yaitu sebesar 0,016 gr/l. Berdasarkan
persamaan (4.2) dan persamaan (4.4) dan dengan melihat nilai rata-rata TSS pada
setiap titik pengamatan WS Brantas di sekitar lokasi industri maka diperoleh
model BOD dan COD untuk setiap titik pengamatan tersebut yang disajikan
dalam Tabel 4.3 sebagai berikut,
Tabel 4.3 Model BOD dan COD Untuk Setiap Titik Pengamatan di WS Brantas di
Sekitar Lokasi Industri
No. Nama Industri Model Estimasi
BOD Model Estimasi COD
1 Dinas Pemotongan
Hewan Malang 0,082 2,44x− + 21,732 69,664 1331,965x x− +
2 PT. Pindad 0,00597 0,215x− 20,034 5,004 326,922x x− +
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
No. Nama Industri Model Estimasi
BOD Model Estimasi COD
3 PT. Eka Mas
Fortuna 0,013 1,418x− + 20,082 13,56 698,944x x− +
4 Peternakan Babi
Sempulur 0,082 2,44x− + 21,732 69,664 1331,965x x− +
5 Peternakan Babi
Delta 0,082 2,44x− + 21,732 69,664 1331,965x x− +
6 CV. Sartimbul 0,082 2,44x− + 21,732 69,664 1331,965x x− +
7 Peternakan Babi
Hanjoyo 0,487 0,25x+ 23,182 80,816 1353,412x x− +
8 PT. Setia Kawan 0,024 1,251x+ 20,971 55,768 1268,511x x− +
9 PT. Surya Zig Zag 0,037 2,466x− + 20, 216 25,538 965,908x x− +
10 PT. Surya
Pamenang 0,037 2,466x− + 20, 216 25,538 965,908x x− +
11 UD. Sumberejo 0,487 0,25x+ 23,182 80,816 1353,412x x− +
12 PT. Jaya Kertas 0,037 2,466x− + 20, 216 25,538 965,908x x− +
13 PT. Cheil Jedang 0,013 1,418x− + 20,082 13,56 698,944x x− +
14 PT. Ajinomoto
Indonesia 0,013 1,418x− + 20,082 13,56 698,944x x− +
15 PT. Darmala 0,037 2,466x− + 20, 216 25,538 965,908x x− +
16 PT. Pakerin 0,024 1,251x+ 20,971 55,768 1268,511x x− +
17 PT. Sateliti Sriti 0,013 1,418x− + 20,082 13,56 698,944x x− +
18 PT. Tjiwi Kimia 0,037 2,466x− + 20, 216 25,538 965,908x x− +
dari Tabel 4.3 dapat dilihat bahwa titik pengamatan yang mempunyai nilai BOD
dan COD terendah adalah titik pengamatan di sekitar lokasi PT Pindad yang dapat
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
dilihat dari model BOD dan COD berturut-turut adalah 0,00597 0,215x− dan
20,034 5,004 326,922x x− + , hal ini berarti nilai TSS pada titik pengamatan di
WS Brantas di sekitar lokasi PT Pindad terletak pada interval 0,01135x < ,
sedangkan nilai BOD dan COD tertinggi adalah pada titik pengamatan di sekitar
lokasi Peternakan Babi Hanjoyo dan UD. Sumberejo yang dapat dilihat dari
model BOD dan COD berturut-turut adalah 0,487 0,25x+ dan
23,182 80,816 1353,412x x− + , hal ini berarti nilai TSS pada titik pengamatan di
WS Brantas di sekitar lokasi Peternakan Babi Hanjoyo dan UD. Sumberejo
terletak pada interval 0, 26x ≥ .
Dari persamaan (4.2) dan persamaan (4.4) diperoleh nilai MSE sebesar 0,143 dan
R-Square sebesar 86,14%. Plot antara hasil observasi dan estimasi BOD terhadap
TSS ditunjukkan pada Gambar 4.3 sebagai berikut,
Gambar 4.3 Plot Observasi dan Estimasi Data BOD terhadap TSS
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
Pada Gambar 4.3 di atas menujukkan bentuk kurva estimasi dan plot observasi
BOD terhadap TSS. Dalam Gambar 4.3 tersebut dapat dilihat perubahan bentuk
kurva estimasi. Kurva tersebut juga menunjukkan perubahan bentuk sesuai nilai
titik knot, ketika nilai TDS kurang dari 0,01135 sampai nilai TDS kurang dari
0,26 kurva mengalami kenaikan yang sangat tinggi yaitu dengan rata-rata nilai
kemiringan kurva 1,87 dan ketika nilai TDS 0,26 dan selebihnya perubahan nilai
kenaikan kurva konstan. Sedangakan untuk plot antara hasil estimasi dan
observasi COD terhadap TSS ditunjukkan pada Gambar 4.4 sebagai berikut,
Gambar 4.4 Plot Observasi dan Estimasi Data COD terhadap TSS
Pada Gambar 4.4 di atas menujukkan bentuk kurva estimasi dan plot observasi
COD terhadap TSS. Dalam Gambar 4.4 tersebut dapat dilihat perubahan bentuk
kurva estimasi. Kurva tersebut juga menunjukkan perubahan bentuk sesuai nilai
titik knot. Perubahan kurva sangat tinggi kecuali ketika nilai TDS diantara 0,26
sampai 0,83, perubahan nilai TDS lebih rendah yang ditunjukkan oleh bentuk
kurva dengan rata-rata nilai kemiringan 1,06.
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
Plot hasil estimasi BOD dan COD terhadap TSS dapat dilihat dalam
Gambar 4.5 sebagai berikut
Gambar 4.5 Plot Hasil Estimasi BOD dan COD terhadap TSS
Gambar 4.5 menunjukkan bahwa nilai BOD dan COD mengalami kenaikan
seiring bertambahnya nilai TSS, akan tetapi nilai kenaikan COD lebih tinggi
dibandingkan nilai kenaikan BOD dan dapat dilihat bahwa nilai COD selalu lebih
besar daripada nilai BOD hal ini dikarenakan nilai BOD hanya terpengaruh pada
jumlah TSS dan zat organik yang ada dalam air. Sedangkan COD adalah total
keseluruhan dari pengotor TSS, zat organik, mineral bervalensi rendah, ditambah
dengan zat kimia yang menyerap oksigen. Nurbana (2015) menyatakan ketika
nilai BOD kurang dari sepertiga nilai COD, berarti air limbah tersebut
mengandung banyak sekali zat penangkap oksigen diluar dari TSS ataupun zat
organik.
0
2
4
6
8
10
0 0,5 1 1,5 2
gr/l
estimasi BOD estimasi COD
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
BAB V
PENUTUP
5.1 Kesimpulan
Berdasarkan hasil analisis yang telah dilakukan, kesimpulan yang diperoleh
adalah sebagai berikut :
1. Berdasarkan model yang diperoleh, dapat disimpulkan titik pengamatan
yang mempunyai nilai BOD dan COD terendah adalah titik pengamatan di
sekitar lokasi PT Pindad yang dapat dilihat dari model BOD dan COD
berturut-turut adalah 5,966 0,215x− dan 233,690 5,004 0,326x x− + , hal ini
berarti nilai TSS pada titik pengamatan di WS Brantas di sekitar lokasi PT
Pindad terletak pada interval 0,01135x < , sedangkan nilai BOD dan COD
tertinggi adalah pada titik pengamatan di sekitar lokasi Peternakan Babi
Hanjoyo dan UD. Sumberejo yang dapat dilihat dari model BOD dan COD
berturut-turut adalah 463,697 0,25x+ dan 21572,391 3,294 0,0034x x− + ,
hal ini berarti nilai TSS pada titik pengamatan di WS Brantas di sekitar
lokasi Peternakan Babi Hanjoyo dan UD. Sumberejo terletak pada interval
0, 26x ≥ .
2. Hasil plot estimasi BOD dan COD menunjukkan bahwa nilai BOD dan
COD mengalami kenaikan seiring bertambahnya nilai TSS, akan tetapi nilai
kenaikan COD lebih tinggi dibandingkan nilai kenaikan BOD, dengan rata-
rata nilai kenaikan BOD dan COD berturut-turut adalah 0,017 gr/l dan 0,163
gr/l. Berdasarkan plot hasil estimasi BOD dan COD pada Gambar 4.5 dapat
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
dilihat bahwa nilai COD selalu lebih besar daripada nilai BOD hal ini
dikarenakan nilai BOD hanya terpengaruh pada jumlah TSS dan zat organik
yang ada dalam air. Sedangkan COD adalah total keseluruhan dari pengotor
TSS, zat organik, mineral bervalensi rendah, ditambah dengan zat kimia
yang menyerap oksigen. Ketika nilai BOD kurang dari sepertiga nilai COD,
berarti air limbah tersebut mengandung banyak sekali zat penangkap
oksigen diluar dari TSS ataupun zat organik.
5.2 Saran
1. Diharapkan adanya penambahan data untuk penilitan selanjutnya sehingga
model dapat digunakan untuk insample dan outsample data.
2. Pemodelan BOD dan COD pada titik WS Brantas di sekitar lokasi industri
dapat dilakukan dengan menambah variabel prediktor yang berpengaruh,
sehingga model yang diperoleh lebih signifikan dan estimasi respon yang
diperoleh lebih mendekati nilai yang sebenarnya.
3. Pemodelan BOD dan COD pada titik WS Brantas di sekitar lokasi industri
dapat diestimasi menggunakan pendekatan regresi semiparametrik dengan
variabel X diasumsikan parametrik.
4. Pemodelan BOD dan COD pada titik WS Brantas di sekitar lokasi industri
dapat dietimasi menggunakan pendekatan spasial dengan mengasumsikan
variabel respon dependen satu sama lain.
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
DAFTAR PUSTAKA
Alfiani, M., Indah, M., dan Tiani, W. 2014. Model Regresi Nonparametrik
Berdasarkan Estimator Lokal Kernel pada Kasus Pertumbuhan Balita. Jurnal Statistika Universitas Muhammadiyah Semarang, 2(1).
Brase, C., dan Corine, P. B. 2013. Understanding Basic Statistic Sixth Edition. The United States of America: Brooks/Cole Cengage Language.
Box, G. E. (1949). A General Distribution Theory for a Class of Likelihood Criteria.
Budiantara, I. N. 2012. Penelitian Bidang Regresi Spline Menuju Terwujudnya Penelitian Statistika yang Mandiri dan Berkarakter. Seminar Nasional FMIPA Undiksha. Singaraja: Institut Teknologi Sepuluh November.
Eubank, R. L. 1999. Nonparametric Regression and Spline Smoothing Second Edition. New York:Marcel Dekker.
Farebrother, R. W. (1988). Linear Least Square Computations. New York: Marcel Dekker, Inc.
Frees, E. W. (2003). Longitudinal and Panel Data: Analysis and Aplications for the Social Sciences. Cambridge: Cambrdge University Press.
Harinaldi. (2005). Prinsip-Prinsip Statistik untuk Teknik dan sains. Jakarta: Erlangga.
Herlambang, A. 2006. Pencemaran Air dan strategi Penanggulangannya. Jurnal Ilmiah 19-20.
Jatmiko, A. 2007. Hubungan Kualitas Air Selokan Ngenden Desa Gumpang Kartasura Sukoharjo dengan Air Sumur Penduduk Sekitar. Skripsi. Surakarta: Universitas Sebelas Maret.
Koesnariyanto, R. 2012. Pemodelan Indikator Pencemaran Air Secara Kimia (BOD) dengan Geographically Weighted Regression. Skripsi Surabaya: Fakultas Kesehatan Masyarakat Universitas Airlangga.
Krisnawati, Widya, T. Y., Nurasih, A., dan Santoso, A. M. 2015. Perancangan Molief Bioreactor untuk Remediasi Air Sungai Brantas Kediri Tercemar Limbah Domestik dan Industri. Prosiding Seminar Nasional Pendidikan Biologi 2015. Malang: FKIP Universitas Muhammadiyah Malang. 489
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
Kusumawardani, D. 2010. Evaluasi Ekonomi Air Bersih di Surabaya (Studi Kasus Pada Air PDAM).Majalah Ekonomi. Yogyakarta: Lembaga Penelitian dan Pengabdian Kepada Masyarakat UGM.
Moertinah, S. 2010. Kajian Proses Anaerobk sebagai Alternatif Teknologi Pengolahan Air Limbah Industri Organik Tinggi. Jurnal Riset, 105.
Nurbana, A. (2015). Olah Air.
PJT1. 2014. Laporan Pemantauan Kualitas Air di Wilayah Sungai Brantas dan Bengawan Solo. Surabaya: 2015.
PJT1. 2015. Laporan Pemantauan Kualitas Air di Wilayah Sungai Brantas dan Bengawan Solo. Surabaya: 2016.
Rachmawati, A. A., & Azizah, R. 2005. Perbedaan Kadar BOD, COD, TSS, dan MPN Coliform pada Air Limbah, Sebelum dan Sesudah Pengolahan di RSUD Nganjuk. Jurnal Kesehatan Lingkungan, 99.
Ramadhani, E. 2016. Analisis Pencemaran Kualitas Air Sungai Bengawan Solo Akibat Limbah Industri di Kecamatan Kebakkramat Kabupaten Karanganyar. Skripsi. Surakarta: Universitas Muhammadiyah Surakarta.
Rencher, A. C., & Schaaljee, G. B. (2008). Linier Model in Statistical and Probabilistic Mathematics. USA: Second Edition, John Wiley and Sons, Inc.
Sari, R. P. 2016. Estimasi Model Regresi Nonparametrik Bi-response pada Data Longitudinal Berdasarkan Estimator Weighted Spline Truncated . Skripsi. Surabaya: Universitas Airlangga.
Sukadi, D. 1999. Pencemaran Sungai Akibat Buangan Limbah dan Pengaruhnya Terhadap BOD dan DO. Jurnal. Bandung: FPTK Institut Keguruan dan Ilmu Pendidikan Bandung. 1.
Walpole, R. E. 1997. Pengantar Statistika Edisi Ketiga. Jakarta: PT. Gramedia Pustaka Utama.
Wu, H. L., & Zhang, J.-T. (2006). Nonparametric Regression Methods for Longitudinal Data Analysis. Canada: A Sons John Wiley & Sons, Inc.
Wulandari, I., dan Budiantara, I. N. 2014. Analisis Faktor-Faktor yang Mempengaruhi Presentasi Penduduk Miskin dan Pengeluaran Perkapita Makanan di Jawa Timur menggunakan Regresi Nonparametrik Birespon Spline. Jurnal Sains dan Seni POMITS, 2337-3520.
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
Lampiran 1. Data BOD, COD, dan TSS 18 Titik WS Brantas di Sekitar
Lokasi Industri
SUBYEK Triwulan TSS (gr/l) BOD (gr/l) COD (gr/l) Dinas Pemotongan
Hewan Malang
2 0,177 0,8864 2,37 3 0,2748 0,3227 0 4 0,145 0,1536 0,4451
PT. Pindad 2 0 0,0314 0,1015 3 0 0,0177 0,06448 4 0 0,0773 0,2228
PT. Eka Mas Fortuna 2 0,0434 0,01175 0,033 3 0,0087 0,0202 0,04963 4 0,0131 0,02435 0,05795
Peternakan Babi
Sempulur
2 0,2812 0,2889 1,3 3 0,0526 0,1752 0,4712 4 0,1722 0,1507 0,5111
Peternakan Babi Delta 2 0,3515 0,7414 1,3838 3 0,163 0,0617 0,1939 4 0,0539 0,0661 0,1899
CV. Sartimbul 2 0,0433 0,1027 0,3587 3 0,148 0,09355 0,2494 4 0,273 1,047 3,2
Peternakan Babi
Hanjoyo
2 0,195 0,3089 1,05 3 0,357 0,1311 0,3232 4 0,832 0,7823 1,95
PT. Setia Kawan 2 0,0473 0,1664 0,4185 3 0,0468 0,1677 0,6423 4 0,0961 0,1198 0,3925
PT. Surya Zig Zag 2 0,1134 0,5963 2,13 3 0,03 0,01955 0,05899 4 0,0061 0,0102 0,02119
PT. Surya Pamenang 2 0,0224 0,02218 0,05471 3 0,0592 0,1018 0,3716 4 0,0225 0,0138 0,03963
UD. Sumberejo 2 1,774 0,3764 8,98 3 1,169 1,377 3 4 0,6964 0,5173 1,27
PT. Jaya Kertas 2 0,014 0,0081 0,03 3 0,072 0,082 0,2931 4 0,008 0,0097 0,0551
PT. Cheil Jedang 2 0,0036 0,03153 0,1196
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
3 0,044 0,0256 0,1055 4 0,016 0,01754 0,09603
PT. Ajinomoto
Indonesia
2 0,01 0,00293 0,00938 3 0,011 0,00292 0,01285 4 0,02 0,01428 0,02468
PT. Darmala 2 0,045 0,00977 0,04108 3 0,055 0,01294 0,04755 4 0,019 0,0174 0,06521
PT. Pakerin 2 0,164 0,09593 0,4233 3 0,004 0,01062 0,0361 4 0,08 0,0876 0,5898
PT. Sateliti Sriti 2 0,0095 0,00575 0,01752 3 0,0201 0,0058 0,0112 4 0,0199 0,0513 0,1447
PT. Tjiwi Kimia 2 0,03 0,00991 0,04014 3 0,004 0,01062 0,0361 4 0,102 0,0144 0,02787
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
Lampiran 2. Program Estimasi Model BOD dan COD dengan Pendekatan
Regresi Nonparametrik Birespon pada Data Longitudinal
Berdasarkan Estimator Spline Truncated Menggunakan Aplikasi
OSS-R
trun<-function(prediktor,knot,orde)
prediktor[prediktor<knot]<-knot
b<-(prediktor-knot)^orde
return(b)
quant<-function(prediktor,p)
r<-quantile(prediktor,seq(0,1,by=1/p))
return(r)
spline<-function(data)
t<-data[,1]
tbaru<-sort(unique(t))
alfa<-as.numeric(readline("Inputkan nilai alfa : "))
uji_korelasi<-cor.test(data[,2],data[,3],alternative="two.sided",method="pearson")
cat("==========================================================\n")
cat("\t\tUJI KORELASI\n")
cat("==========================================================")
print(uji_korelasi)
cat("==========================================================\n")
if(uji_korelasi$p.value>alfa)
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
cat("Tidak dapat digunakan analisis regresi birespon/n")
else
n<-as.numeric(readline("Inputkan banyak subyek : "))
P<-as.numeric(readline("Inputkan maksimum orde : "))
p<-matrix(0,(P^2),2)
p[,2]<-rep(c(1:P),P)
a<-rep(1,P)
for(i in 1:P)
a<-rep(i,P)
p[(P*(i-1)+1):(P*i),1]<-a
print(p)
nn<-length(t)
jp<-3
minimumGCV<-rep(0,(P^2))
for(m in 1:(P^2))
cat("\nORDE respon 1 :",p[m,1],"; ORDE respon 2 :",p[m,2],"\n")
cat("==================================================\n")
cat("KNOT\t\t MSE\t\t GCV\n")
cat("==================================================\n")
w1<-quant(tbaru,1+1)
y<-c(data[,2],data[,3])
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
MSE<-rep(0,15)
GCV<-rep(0,15)
v11<-matrix(0,nn,p[m,1]+1)
v12<-matrix(0,nn,p[m,2]+1)
for(i in 1:(p[m,1]+1))
v11[,i]<-data[,1]^(i-1)
for(i in 1:(p[m,2]+1))
v12[,i]<-data[,1]^(i-1)
v21<-matrix(0,nn,1)
v22<-matrix(0,nn,1)
for(j in 1:1)
v21[,j]<-trun(data[,1],w1[j+1],p[m,1])
for(j in 1:1)
v22[,j]<-trun(data[,1],w1[j+1],p[m,2])
XA<-cbind(v11,v21)
XB<-cbind(v12,v22)
XC<-matrix(0,nn,(p[m,2]+1+1))
XD<-matrix(0,nn,(p[m,1]+1+1))
A<-cbind(XA,XC)
B<-cbind(XD,XB)
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
X<-rbind(A,B)
betatopi<-solve(t(X)%*%X)%*%t(X)%*%y
ytopi<-X%*%betatopi
Ah<-X%*%solve(t(X)%*%X)%*%t(X)
MSE[1]<-(t(y-ytopi)%*%(y-ytopi))/(2*nn)
GCV[1]<-MSE[1]/(1-((1/(2*nn))*sum(diag(Ah))))^2
cat(t(w1[2:(1+1)]),"\t\t",MSE[1],"\t",GCV[1],"\n")
cat("--------------------------------------------------\n")
K<-1
repeat
K<-K+1
w<-quant(tbaru,K+1)
y<-c(data[,2],data[,3])
v11<-matrix(0,nn,p[m,1]+1)
v12<-matrix(0,nn,p[m,2]+1)
for(i in 1:(p[m,1]+1))
v11[,i]<-data[,1]^(i-1)
for(i in 1:(p[m,2]+1))
v12[,i]<-data[,1]^(i-1)
v21<-matrix(0,nn,K)
v22<-matrix(0,nn,K)
for(j in 1:K)
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
v21[,j]<-trun(data[,1],w[j+1],p[m,1])
for(j in 1:K)
v22[,j]<-trun(data[,1],w[j+1],p[m,2])
XA<-cbind(v11,v21)
XB<-cbind(v12,v22)
XC<-matrix(0,nn,(p[m,2]+K+1))
XD<-matrix(0,nn,(p[m,1]+K+1))
A<-cbind(XA,XC)
B<-cbind(XD,XB)
X<-rbind(A,B)
betatopi<-solve(t(X)%*%X)%*%t(X)%*%y
ytopi<-X%*%betatopi
Ah<-X%*%solve(t(X)%*%X)%*%t(X)
MSE[K]<-(t(y-ytopi)%*%(y-ytopi))/(2*nn)
GCV[K]<-MSE[K]/(1-((1/(2*nn))*sum(diag(Ah))))^2
if(GCV[K]>GCV[K-1])break
cat(t(w[2:(K+1)]),"\t\t",MSE[K],"\t",GCV[K],"\n")
cat("--------------------------------------------------\n")
g<-GCV[K-1]
print(g)
minimumGCV[m]<-g
print(minimumGCV)
for(a in 1:(P^2))
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
if(minimumGCV[a]==min(minimumGCV))
kecilGCV<-minimumGCV[a]
pmax<-a
cat("Nilai GCV minimum adalah",kecilGCV,"\n")
cat("dengan orde respon 1 :",p[pmax,1],"\n")
cat("dan orde respon 2 :",p[pmax,2],"\n")
KO<-as.numeric(readline("Input jumlah knot maksimum : "))
w1<-rep(0,KO)
for(i in 1:KO)
cat("Input titik knot optimum ke-",i)
w1[i]<-as.numeric(readline(" = "))
v11<-matrix(0,nn,p[pmax,1]+1)
v12<-matrix(0,nn,p[pmax,2]+1)
for(i in 1:(p[pmax,1]+1))
v11[,i]<-data[,1]^(i-1)
for(i in 1:(p[pmax,2]+1))
v12[,i]<-data[,1]^(i-1)
v21<-matrix(0,nn,KO)
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
v22<-matrix(0,nn,KO)
for(j in 1:KO)
v21[,j]<-trun(data[,1],w1[j],p[pmax,1])
for(j in 1:KO)
v22[,j]<-trun(data[,1],w1[j],p[pmax,2])
XA<-cbind(v11,v21)
XB<-cbind(v12,v22)
XC<-matrix(0,nn,(p[pmax,2]+KO+1))
XD<-matrix(0,nn,(p[pmax,1]+KO+1))
A<-cbind(XA,XC)
B<-cbind(XD,XB)
XX<-rbind(A,B)
betatopi<-solve(t(XX)%*%XX)%*%t(XX)%*%y
ytopi<-XX%*%betatopi
error<-y-ytopi
ER<-matrix(0,nn,3)
ER[,1]<-error[1:nn]
ER[,2]<-error[(nn+1):(2*nn)]
c<-rep(0,(nn+1))
c[1]<-0
for(i in 1:n)
c[i+1]<-jp*i
ER[(c[i]+1):c[i+1],3]<-rep(i,jp)
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
hetero<-boxM(ER[,-3],ER[,3])
hettes<-hetero$p.value
print(hetero)
print(hettes)
if(hettes<alfa)
c<-rep(0,(nn+1))
c[1]<-0
vr1<-rep(0,nn)
vr2<-rep(0,nn)
cv<-rep(0,nn)
for(i in 1:n)
c[i+1]<-jp*i
da<-cbind(ER[(c[i]+1):c[i+1],1],ER[(c[i]+1):c[i+1],2])
vr<-var(da)
vr1[(c[i]+1):c[i+1]]<-rep(vr[1,1],jp)
vr2[(c[i]+1):c[i+1]]<-rep(vr[2,2],jp)
cv[(c[i]+1):c[i+1]]<-rep(vr[1,2],jp)
A<-diag(vr1,nn)
B<-diag(cv,nn)
C<-B
D<-diag(vr2,nn)
AA<-cbind(A,B)
BB<-cbind(C,D)
W<-rbind(AA,BB)
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
else
cv<-rep(0,nn)
da<-cbind(error[,1],error[,2])
vr<-var(da)
A<-diag(vr[1,1],nn)
B<-diag(vr[1,2],nn)
C<-B
D<-diag(vr[2,2],nn)
AA<-cbind(A,B)
BB<-cbind(C,D)
W<-rbind(AA,BB)
minimumGCV<-rep(0,(P^2))
for(m in 1:(P^2))
cat("\nORDE respon 1 :",p[m,1],"; ORDE respon 2 :",p[m,2],"\n")
cat("==================================================\n")
cat("KNOT\t\t MSE\t\t GCV\n")
cat("==================================================\n")
w1<-quant(tbaru,1+1)
y<-c(data[,2],data[,3])
MSE<-rep(0,8)
GCV<-rep(0,8)
v11<-matrix(0,nn,p[m,1]+1)
v12<-matrix(0,nn,p[m,2]+1)
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
for(i in 1:(p[m,1]+1))
v11[,i]<-data[,1]^(i-1)
for(i in 1:(p[m,2]+1))
v12[,i]<-data[,1]^(i-1)
v21<-matrix(0,nn,1)
v22<-matrix(0,nn,1)
for(j in 1:1)
v21[,j]<-trun(data[,1],w1[j+1],p[m,1])
for(j in 1:1)
v22[,j]<-trun(data[,1],w1[j+1],p[m,2])
XA<-cbind(v11,v21)
XB<-cbind(v12,v22)
XC<-matrix(0,nn,(p[m,2]+1+1))
XD<-matrix(0,nn,(p[m,1]+1+1))
A<-cbind(XA,XC)
B<-cbind(XD,XB)
X<-rbind(A,B)
betatopi<-solve(t(X)%*%solve(W)%*%X)%*%t(X)%*%solve(W)%*%y
ytopi<-X%*%betatopi
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
Ah<-X%*%solve(t(X)%*%solve(W)%*%X)%*%t(X)%*%solve(W)
MSE[1]<-(t(y-ytopi)%*%(y-ytopi))/(2*nn)
GCV[1]<-MSE[1]/(1-((1/(2*nn))*sum(diag(Ah))))^2
cat(t(w1[2:(1+1)]),"\t\t",MSE[1],"\t",GCV[1],"\n")
cat("--------------------------------------------------\n")
K<-1
repeat
K<-K+1
w1<-quant(tbaru,K+1)
y<-c(data[,2],data[,3])
v11<-matrix(0,nn,p[m,1]+1)
v12<-matrix(0,nn,p[m,2]+1)
for(i in 1:(p[m,1]+1))
v11[,i]<-data[,1]^(i-1)
for(i in 1:(p[m,2]+1))
v12[,i]<-data[,1]^(i-1)
v21<-matrix(0,nn,K)
v22<-matrix(0,nn,K)
for(j in 1:K)
v21[,j]<-trun(data[,1],w1[j+1],p[m,1])
for(j in 1:K)
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
v22[,j]<-trun(data[,1],w1[j+1],p[m,2])
XA<-cbind(v11,v21)
XB<-cbind(v12,v22)
XC<-matrix(0,nn,(p[m,2]+K+1))
XD<-matrix(0,nn,(p[m,1]+K+1))
A<-cbind(XA,XC)
B<-cbind(XD,XB)
X<-rbind(A,B)
betatopi<-solve(t(X)%*%solve(W)%*%X)%*%t(X)%*%solve(W)%*%y
ytopi<-X%*%betatopi
Ah<-X%*%solve(t(X)%*%solve(W)%*%X)%*%t(X)%*%solve(W)
MSE[K]<-(t(y-ytopi)%*%(y-ytopi))/(2*nn)
GCV[K]<-MSE[K]/(1-((1/(2*nn))*sum(diag(Ah))))^2
if(GCV[K]>GCV[K-1])break
cat(t(w1[2:(K+1)]),"\t\t",MSE[K],"\t",GCV[K],"\n")
cat("--------------------------------------------------\n")
g<-GCV[K-1]
print(g)
minimumGCV[m]<-g
print(minimumGCV)
for(a in 1:(P^2))
if(minimumGCV[a]==min(minimumGCV))
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
kecilGCV<-minimumGCV[a]
pmax<-a
cat("Nilai GCV minimum adalah",kecilGCV,"\n")
cat("dengan orde respon 1 :",p[pmax,1],"\n")
cat("dan orde respon 2 :",p[pmax,2],"\n")
KO<-as.numeric(readline("Input jumlah knot maksimum : "))
w<-rep(0,KO)
for(i in 1:KO)
cat("Input titik knot optimum ke-",i)
w[i]<-as.numeric(readline(" = "))
v11<-matrix(0,nn,p[pmax,1]+1)
v12<-matrix(0,nn,p[pmax,2]+1)
for(i in 1:(p[pmax,1]+1))
v11[,i]<-data[,1]^(i-1)
for(i in 1:(p[pmax,2]+1))
v12[,i]<-data[,1]^(i-1)
v21<-matrix(0,nn,KO)
v22<-matrix(0,nn,KO)
for(j in 1:KO)
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
v21[,j]<-trun(data[,1],w[j],p[pmax,1])
for(j in 1:KO)
v22[,j]<-trun(data[,1],w[j],p[pmax,2])
XA<-cbind(v11,v21)
XB<-cbind(v12,v22)
XC<-matrix(0,nn,(p[pmax,2]+KO+1))
XD<-matrix(0,nn,(p[pmax,1]+KO+1))
A<-cbind(XA,XC)
B<-cbind(XD,XB)
XX<-rbind(A,B)
betatopi<-solve(t(XX)%*%solve(W)%*%XX)%*%t(XX)%*%solve(W)%*%y
cat("\nNilai betatopi untuk respon 1 adalah\n")
for(a in 1:(1+p[pmax,1]+KO))
cat((a-1),"\t",betatopi[a],"\n")
cat("Nilai betatopi untuk respon 2 adalah\n")
for(b in (2+p[pmax,1]+KO):(length(betatopi)))
cat((b-(2+p[pmax,1]+KO)),"\t",betatopi[b],"\n")
ytopi<-XX%*%betatopi
ytopisatu<-ytopi[1:nn]
ytopidua<-ytopi[(nn+1):(2*nn)]
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
MSEakhir<-(t(y-ytopi)%*%(y-ytopi))/(2*nn)
JKT<-t(y-(mean(y)))%*%(y-(mean(y)))
JKG<-t(y-ytopi)%*%(y-ytopi)
RK<-1-(JKG/JKT)
xx<-c(t,t)
AA<-cbind(xx,y,ytopi)
cat("\nHasil Estimasinya adalah\n")
cat("=================================\n")
kolom<-cbind(t,ytopisatu,ytopidua)
est<-unique(kolom[order(t),1:3])
print(est)
cat("=================================\n")
cat("\n\nMSE = ",MSEakhir,"\n")
cat("R-square = ",RK,"\n")
TSS<-sort(data[,1])
BOD<-data[,2]
COD<-data[,3]
MSEBOD<-(t(BOD-ytopisatu)%*%(BOD-ytopisatu))/nn
MSECOD<-(t(COD-ytopidua)%*%(COD-ytopidua))/nn
print(MSEBOD)
print(MSECOD)
sBOD<-BOD[order(data[,1])]
sCOD<-COD[order(data[,1])]
sbbtopi<-ytopisatu[order(data[,1])]
stbtopi<-ytopidua[order(data[,1])]
plot(TSS,sBOD,xlab="TSS",ylab="BOD",type="p")
lines(TSS,sbbtopi,xlab="TSS",ylab="BOD",col="red",lwd=3)
win.graph()
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
plot(TSS,sCOD,xlab="TSS",ylab="COD",type="p")
lines(TSS,stbtopi,xlab="TSS",ylab="COD",col="red",lwd=3)
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
Lampiran 3. Output Program Estimasi Model BOD dan COD dengan Pendekatan Regresi Nonparametrik Birespon pada Data Longitudinal Berdasarkan Estimator Spline Truncated Menggunakan Aplikasi OSS-R
> spline(Dataset)
Inputkan nilai alfa : 0.05
==========================================================
UJI KORELASI
==========================================================
Pearson's product-moment correlation
data: data[, 2] and data[, 3]
t = 5.4249, df = 52, p-value = 1.532e-06
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.3973797 0.7484551
sample estimates:
cor
0.6011738
==========================================================
Inputkan banyak subyek : 18
Inputkan maksimum orde : 2
[,1] [,2]
[1,] 1 1
[2,] 1 2
[3,] 2 1
[4,] 2 2
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
ORDE respon 1 : 1 ; ORDE respon 2 : 1
==================================================
KNOT MSE GCV
==================================================
0.04995 0.2479039 0.2779269
--------------------------------------------------
[1] 0.2779269
ORDE respon 1 : 1 ; ORDE respon 2 : 2
==================================================
KNOT MSE GCV
==================================================
0.04995 0.1860781 0.2127649
--------------------------------------------------
0.02243333 0.1096 0.1605268 0.1910402
--------------------------------------------------
0.019225 0.04995 0.16375 0.1501151 0.1860923
--------------------------------------------------
[1] 0.1860923
ORDE respon 1 : 2 ; ORDE respon 2 : 1
==================================================
KNOT MSE GCV
==================================================
0.04995 0.2398954 0.2743006
--------------------------------------------------
[1] 0.2743006
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
ORDE respon 1 : 2 ; ORDE respon 2 : 2
==================================================
KNOT MSE GCV
==================================================
0.04995 0.1780696 0.2077004
--------------------------------------------------
0.02243333 0.1096 0.155206 0.1884967
--------------------------------------------------
0.019225 0.04995 0.16375 0.1453917 0.1840114
--------------------------------------------------
[1] 0.1840114
[1] 0.2779269 0.1860923 0.2743006 0.1840114
Nilai GCV minimum adalah 0.1840114
dengan orde respon 1 : 2
dan orde respon 2 : 2
Input jumlah knot maksimum : 3
Input titik knot optimum ke- 1 = 0.019225
Input titik knot optimum ke- 2 = 0.04995
Input titik knot optimum ke- 3 = 0.16375
Box's M-test for Homogeneity of Covariance Matrices
data: ER[, -3]
Chi-Sq (approx.) = 170.29, df = 51, p-value = 9.259e-15
[1] 9.259289e-15
ORDE respon 1 : 1 ; ORDE respon 2 : 1
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
==================================================
KNOT MSE GCV
==================================================
0.04995 0.3105255 0.3481324
--------------------------------------------------
[1] 0.3481324
ORDE respon 1 : 1 ; ORDE respon 2 : 2
==================================================
KNOT MSE GCV
==================================================
0.04995 0.7021605 0.8028624
--------------------------------------------------
0.02243333 0.1096 0.4200848 0.4999357
--------------------------------------------------
0.019225 0.04995 0.16375 0.3132896 0.3883739
--------------------------------------------------
0.01382 0.04336 0.0752 0.1806 0.164626 0.2127643
--------------------------------------------------
0.01135 0.02243333 0.04995 0.1096 0.26 0.1430465 0.1929118
--------------------------------------------------
[1] 0.1929118
ORDE respon 1 : 2 ; ORDE respon 2 : 1
==================================================
KNOT MSE GCV
==================================================
0.04995 0.4659563 0.5327825
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
--------------------------------------------------
0.02243333 0.1096 0.3203815 0.3812805
--------------------------------------------------
0.019225 0.04995 0.16375 0.2993558 0.3711007
--------------------------------------------------
0.01382 0.04336 0.0752 0.1806 0.2607049 0.3369376
--------------------------------------------------
[1] 0.3369376
ORDE respon 1 : 2 ; ORDE respon 2 : 2
==================================================
KNOT MSE GCV
==================================================
0.04995 0.724334 0.8448632
--------------------------------------------------
0.02243333 0.1096 0.4435665 0.5387088
--------------------------------------------------
0.019225 0.04995 0.16375 0.1564189 0.1979677
--------------------------------------------------
[1] 0.1979677
[1] 0.3481324 0.1929118 0.3369376 0.1979677
Nilai GCV minimum adalah 0.1929118
dengan orde respon 1 : 1
dan orde respon 2 : 2
Input jumlah knot maksimum : 5
Input titik knot optimum ke- 1 = 0.01135
Input titik knot optimum ke- 2 = 0.022433
Input titik knot optimum ke- 3 = 0.04995
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
Input titik knot optimum ke- 4 = 0.1096
Input titik knot optimum ke- 5 = 0.26
Nilai betatopi untuk respon 1 adalah
0 0.005966084
1 -0.2152434
2 1.633303
3 1.048057
4 -1.215545
5 1.189208
6 -2.190887
Nilai betatopi untuk respon 2 adalah
0 0.03365039
1 -5.003928
2 326.9218
3 -372.0223
4 266.964
5 -302.6027
6 63.45409
7 21.44725
Hasil Estimasinya adalah
=================================
t ytopisatu ytopidua
[1,] 0.0000 0.005966084 0.03365039
[2,] 0.0000 0.005966084 0.03365039
[3,] 0.0000 0.005966084 0.03365039
[4,] 0.0036 0.005191208 0.01987316
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
[5,] 0.0040 0.005105111 0.01886543
[6,] 0.0040 0.005105111 0.01886543
[7,] 0.0061 0.004653099 0.01529119
[8,] 0.0080 0.004244137 0.01454196
[9,] 0.0087 0.004093467 0.01486093
[10,] 0.0095 0.003921272 0.01561777
[11,] 0.0100 0.003813650 0.01630329
[12,] 0.0110 0.003598407 0.01816472
[13,] 0.0131 0.006004675 0.02306266
[14,] 0.0140 0.007280929 0.02505954
[15,] 0.0160 0.010117047 0.02923547
[16,] 0.0190 0.014371225 0.03482284
[17,] 0.0199 0.015647478 0.03634075
[18,] 0.0200 0.015789284 0.03650490
[19,] 0.0201 0.015931090 0.03666814
[20,] 0.0224 0.019192626 0.04017381
[21,] 0.0225 0.019404652 0.04031661
[22,] 0.0300 0.037900526 0.06365063
[23,] 0.0300 0.037900526 0.06365063
[24,] 0.0433 0.070699876 0.16640591
[25,] 0.0434 0.070946487 0.16747581
[26,] 0.0440 0.072426157 0.17398835
[27,] 0.0450 0.074892274 0.18519757
[28,] 0.0468 0.079331284 0.20649235
[29,] 0.0473 0.080564342 0.21266271
[30,] 0.0526 0.090413565 0.28276358
[31,] 0.0539 0.092039308 0.29978663
[32,] 0.0550 0.093414937 0.31397759
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P
[33,] 0.0592 0.098667337 0.36636401
[34,] 0.0720 0.114674653 0.50844901
[35,] 0.0800 0.124679225 0.58381713
[36,] 0.0961 0.144813426 0.70416783
[37,] 0.1020 0.152191798 0.73779155
[38,] 0.1134 0.170967304 0.78775230
[39,] 0.1450 0.248064338 0.89259353
[40,] 0.1480 0.255383677 0.90075261
[41,] 0.1630 0.291980370 0.93688103
[42,] 0.1640 0.294420150 0.93901303
[43,] 0.1722 0.314426342 0.95519143
[44,] 0.1770 0.326137284 0.96358312
[45,] 0.1950 0.370053317 0.98795814
[46,] 0.2730 0.531874594 0.96777661
[47,] 0.2748 0.532322601 0.96581762
[48,] 0.2812 0.533915514 0.95907075
[49,] 0.3515 0.551412673 0.90740270
[50,] 0.3570 0.552781583 0.90509558
[51,] 0.6964 0.637255775 1.24993670
[52,] 0.8320 0.671005629 1.65579163
[53,] 1.1690 0.754882479 3.32732523
[54,] 1.7740 0.905462579 8.70017374
=================================
MSE = 0.1430465
R-square = 0.8613784
ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA
SKRIPSI PEMODELAN BILOGICAL... WINDHU MANJA P