Post on 17-Oct-2015
description
5/27/2018 Absen Jurnal Johan 2010 Ok
1/14
2010 - Johan Page 1
Analisa Keranjang Pasar dengan Algoritma Apriori pada Data Transaksi
Mini Market Lima Bintang
JohanE-mail : Johan_mkom@yahoo.com
ABSTRAK
Algoritma apriori termasuk jenis aturan asosiasi pada data mining. Algoritma apriori atau
association rule miningadalah teknik data mininguntuk menemukan aturan asosiatif antara satu
kombinasi item, dari analisa pembelian di suatu pasar swalayan dapat diketahuinya berapa besar
kemungkinan seorang pelanggan membeli roti bersamaan dengan susu. Dengan pengetahuan
tersebut, pemilik pasar swalayan dapat mengatur penempatan barangnya atau merancang kampanye
pemasaran dengan memakai kupon diskon untuk kombinasi barang tertentu. Berdasarkan uji coba
Nilai Support dapat diambil kesimpulan bahwa semakin kecil nilai support maka jumlah itemsetyang dihasilkan semakin banyak, dan jumlah kaidah asosiasi yang dibentuk semakin banyak pula.
Kata kunci : Data Mining, Association Rules, AlgoritmaApriori
ABSTRACT
Apriori is an algorithm provided in association rules in data mining. Apriori or association rule
mining is data mining techniques to discover the associative rules between one combination of
items, from analysis of the purchase in a supermarket can know how likely a customer buys bread
with milk. With this knowledge, a supermarket owner can manage the placement of merchandise or
designing marketing campaigns using a combination of discount coupons for certain items. Based
on the experimental value of Support can be concluded that the smaller the value of support then
the number of itemset generated more and more, and the number of association rules established
more and more also.
Keyword :Data Mining, Association Rules, Apriori Algorithm
I. PENDAHULUANI.1 LATAR BELAKANG
Data mining adalah kombinasisecara logis antara pengetahuan data, dan
analisa statistik yang dikembangkan
dalam pengetahuan bisnis atau suatu
proses yang menggunakan teknikstatistik, matematika, kecerdasan buatan,
tiruan dan machine-learning untuk
mengekstraksi dan mengidentifikasiinformasi yang bermanfaat bagi
pengetahuan yang terkait dari berbagai
database besar.
Algoritma apriori adalahalgoritma analisis keranjang pasar yang
digunakan untuk menghasilkan aturan
asosiasi, dengan pola if-then. Algoritma
apriori menggunakan pendekatan iteratifyang dikenal dengan level-wise search,
dimana k-kelompok produk digunakan
untuk mengeksplorasi (k+1)-kelompok
produk atau (k+1)-itemset.
Dalam penelitian ini peneliti mencoba
menganalisa data transaksi penjualan
pada toko Mini Market Lima BintangPekanbaru. Data yang diambil sebagai
contoh kasus adalah data transaksi
penjualan di mini market. Melalui
5/27/2018 Absen Jurnal Johan 2010 Ok
2/14
2010 - Johan Page 2
penelitian ini diharapkan dapat ditemukanlangkah-langkah dan masalah (sebagai
model) dalam menerapkan algoritma
apriori ini dan diketahui apakah data
transaksi penjualan mini market cukup
berharga untuk ditambang dengan teknikanalisis data market. Penelitian ini
membahas algoritma apriori, analisis ,
imp
Implementasi sistem analisis
keranjang pasar dengan algoritmaapriori, dan eksperimen penggunaan
sistem dengan data transaksi penjualan
toko Mini Market Lima Bintang
Pekanbaru.
I.2 PERUMUSAN MASALAH
Berdasarkan latar belakang di atas, dapat
dirumuskan masalahnya, sebagai berikut :
1. Bagaimana menganalisa data untukkeperluan strategi pemasaran, desain
katalog dan proses pembuatankeputusan bisnis ?
2. Bagaimana menemukan pola-polahimpunan data yang sifatnyatersembunyi ?
3. Bagaimana menerapkan algoritmaapriori dalam data market ?
Tujuan analisis keranjang pasar padatransaksi penjualan adalah untuk
merancang strategi penjualan atau
pemasaran yang efektif denganmemanfaatkan data transaksi penjualan
yang telah tersedia di perusahaan.
Dengan menggunakan teknologi datamining, orang tidak perlu melakukan
analisis data secara manual, melainkan
dapat menggunakan teknik data mining
untuk ini.
I.3 TUJUAN PENELITITAN
Tujuan analisis keranjang pasar pada
transaksi penjualan adalah untukmerancang strategi penjualan atau
pemasaran yang efektif dengan
memanfaatkan data transaksi penjualanyang telah tersedia di mini market.
Dengan menggunakan teknologi data
mining, orang tidak perlu melakukan
analisis data secara manual, melainkandapat menggunakan teknik data mining
untuk ini. Teknik analisis keranjang pasar
bertujuan untuk menemukan pola yang
berupa produk-produk yang sering dibelibersamaan (atau cenderung muncul
bersama dalam sebuah transaksi) dari
data transaksi yang pada umumnya
berukuran sangat besar. Perusahaan laludapat menggunakan pola ini untuk
menempatkan produk yang sering dibeli
bersamaan ke dalam sebuah area yangberdekatan, merancang tampilan produk
di katalog, merancang kupon diskon(untuk diberikan kepada pelanggan yangmembeli produk tertentu), merancang
penjualan paket produk, dll. Penelitian ini
bertujuan untuk mengaplikasikanalgoritma apriori yang merupakan hasil
penelitian yang baru, sebagai teknik
analisis keranjang pasar. Data yang
diambil sebagai contoh kasus adalah datatransaksi mini market. Melalui penelitian
ini diharapkan dapat ditemukan langkah-
langkah dan masalah (sebagai model)dalam menerapkan algoritma ini dan
diketahui apakah data mini market cukup
berharga untuk ditambang dengan teknik
analisis keranjang pasar.
II. TINJAUAN PUSTAKAKnowledge Discovery and Data
Mining(KDD)adalah proses yang dibantuoleh komputer untuk menggali dan
menganalisis sejumlah besar himpunan
data dan mengekstrak informasi danpengetahuan yang berguna. Data mining
tools memperkirakan perilaku dan tren
masa depan, memungkinkan bisnis untukmembuat keputusan yang proaktif dan
berdasarkan pengetahuan.
Data mining tools mampu menjawabpermasalahan bisnis yang secara
tradisional terlalu lama untuk
diselesaikan. Data mining tools
menjelajah database untuk mencari pola
5/27/2018 Absen Jurnal Johan 2010 Ok
3/14
2010 - Johan Page 3
tersembunyi, menemukan infomasi yangprediktif yang mungkin dilewatkan para
pakar karena berada di luar ekspektasi
mereka.
Proses dalam KDD adalah prosesyang digambarkan pada dan terdiri dari
rangkaian proses iteratif sebagai berikut:
1. Data cleaning, menghilangkan noise
dan data yang inkonsisten.
2. Data integration, menggabungkan
data dari berbagai sumber data yangberbeda
3. Data selection, mengambil data yang
relevan dengan tugas analisis dari
database
4. Data transformation,
Mentransformasi atau menggabungkandata ke dalam bentuk yang sesuai untuk
penggalian lewat operasi summary atau
aggregation.
5. Data mining, proses esensial untuk
mengekstrak pola dari data dengan
metode cerdas.
6.
Pattern evaluation,mengidentifikasikan pola yang menarik
dan merepresentasikan pengetahuan
berdasarkan interestingness measures.
7. Knowledge presentation, penyajian
pengetahuan yang digali kepada
pengguna dengan menggunakanvisualisasi dan teknik representasi
pengetahuan.
Gambar 2.1 Tahap-tahap Data Mining
Algoritma apriori adalah algoritmaanalisis keranjang pasar yang digunakan
untuk menghasilkan aturan asosiasi,
dengan pola if-then. Algoritma apriori
menggunakan pendekatan iteratif yangdikenal dengan level-wise search, dimana
k-kelompok produk digunakan untukmengeksplorasi (k+1)-kelompok produk
atau (k+1)-itemset.
Beberapa istilah yang digunakan dalam
algoritma apriori antara lain:a. Support (dukungan): probabilitas
pelanggan membeli beberapa produk
secara bersamaan dari seluruhtransaksi. Support untuk aturan
X=>Y adalah probabilitas atributatau kumpulan atribut X dan Y yangterjadi bersamaan.
b. Confidence (tingkat kepercayaan):
probabilitas kejadian beberapa produkdibeli bersamaan dimana salah satu
produk sudah pasti dibeli. Contoh: jika
ada n transaksi dimana X dibeli, dan
ada m transaksi dimana X dan Y dibelibersamaan, maka confidence dari
aturan if X then Y adalah m/n.
c. Minimum support: parameter yangdigunakan sebagai batasan frekuensi
kejadian atausupport count yang harus
dipenuhi suatu kelompok data untukdapat dijadikan aturan.
d. Minimum confidence: parameter yang
mendefinisikan minimum level dari
confidence yang harus dipenuhi olehaturan yang berkualitas.
e. Itemset: kelompok produk.
f. Support count: frekuensi kejadianuntuk sebuah kelompok produk atau
itemset dari seluruh transaksi.
g. Kandidat itemset: itemset-itemset yangakan dihitungsupport count-nya.
h.Large itemset: itemset yang sering
terjadi, atau itemset-itemset yangsudah melewati batas minimum
support yang telah diberikan.
Sedangkan notasi-notasi yang digunakan
dalam algoritma apriori antara lain:
5/27/2018 Absen Jurnal Johan 2010 Ok
4/14
2010 - Johan Page 4
a. Ck
adalah kandidat k-itemset, dimana k
menunjukkan jumlah pasangan item.
b. Lkadalah large k-itemset.
c. D adalah basis data transaksi penjualan
dimana |D| adalah banyaknya
transaksi di tabel basis data.
Ada dua proses utama yang dilakukan
algoritma apriori, yaitu:
1. Join (penggabungan): untuk
menemukan Lk, C
kdibangkitkan dengan
melakukan proses join Lk-1
dengan
dirinya sendiri, Ck
=Lk-1
*Lk-1,
lalu anggota
Ck
diambil hanya yang terdapat didalam
Lk-1
.
2. Prune (pemangkasan): menghilangkan
anggota Ck
yang memiliki support count
lebih kecil dari minimum support agar
tidak dimasukkan ke dalam Lk.
Tahapan yang dilakukan algoritma aprioriuntuk membangkitkan large itemset
adalah sebagai berikut:
1. Menelusuri seluruh record dibasis data transaksi dan menghitungsupport count dari tiap item. Ini adalah
kandidat 1-itemset, C1.
2. Large 1-itemset L1
dibangun dengan
menyaring C1
dengansupport count yang
lebih besar sama dengan minimum
support untuk dimasukkan kedalam L1.
3. Untuk membangun L2, algoritmaapriori menggunakan proses join untuk
menghasilkan C2.
4. Dari C2, 2-itemset yang memiliki
support count yang lebih besar samadengan minimum support akan disimpan
ke dalam L2.
5. Proses ini diulang sampai tidak ada
lagi kemungkinan k-itemset.
Contoh tahapan pembangkitan C1, L
1, C
2,
L2, C
3, L
3ditunjukkan pada Gambar 2.
Pembangkitan aturan asosiasi dari largeitemset:
Gambar 2.2 Ilustrasi Algoritma Apriori
Dari beberapa large itemset yang
telah ditemukan, dapat dibangkitkan
aturan-aturan asosiasi yang berkualitas.
Syarat aturan asosiasi yang adalah harusmemenuhi minimum support dan
minimum confidence yang telah
ditentukan. Confidence dari setiap aturanyang dibangkitkan dapat dihitung dengan
menggunakan rumus peluang
Confidence(A=>B) = P(B|A) =support_count(AB)/support_count(A)
dengan support_count (AB) adalah
jumlah transaksi yang berisi itemset A
dan B, dan support_count(A) adalahjumlah transaksi yang berisi itemset A.
Berdasarkan rumusan diatas, aturan
asosiasi dapat dibangkitkan denganlangkah:
1. Untuk setiap itemset l, bangkitkan
seluruh subset l yang tidak kosong.
2. Untuk setiap subset s dari l yang tidakkosong, buat aturan s => (l- s) jika
support_count(l)/support_count(s) >=minimum confidence.
Algoritma apriori memiliki
masalah yaitu harus membangkitkan
kandidat itemset, Ck,
dalam jumlah besar.
(Banyaknya Ck
yang dibangkitkan adalah
kombinasi k dari jumlah itemset Lk-1
atau
k
C( itemset Lk-1)
.) Setelah Ck
terbentuk,
5/27/2018 Absen Jurnal Johan 2010 Ok
5/14
2010 - Johan Page 5
apriori melakukan penelusuran seluruhrecord di basis data untuk menghitung
support count masing-masing itemset
sehingga waktu komputasinya lama.
(Semakin besar jumlah kandidat itemsetsemakin besar komputasinya.)
Bentuk Dasar Aturan Asosiatif
Penting tidaknya suatu aturanassosiatif dapat diketahui dengan dua
parameter, support (nilai penunjang)
yaitu persentase kombinasi item tsb.
dalam database dan confidence(nilaikepastian) yaitu kuatnya hubungan antar
item dalam aturan assosiatif. Aturan
assosiatif biasanya dinyatakan dalam
bentuk :{roti,mentega} -> {susu} (support =
40%, confidence = 50%)Yang artinya : 50% dari transaksi di
database yang memuat item roti dan
mentega juga memuat item susu.
Sedangkan 40% dari seluruh transaksiyang ada di database memuat ketiga item
itu.
Dapat juga diartikan : "Seorangkonsumen yang membeli roti dan
mentega punya kemungkinan 50% untukjuga membeli susu. Aturan ini cukupsignifikan karena mewakili 40% dari
catatan transaksi selama ini."
Analisis asosiasi didefinisikan suatuproses untuk menemukan semua aturan
assosiatif yang memenuhi syarat
minimum untuk support (minimum
support) dan syarat minimum untuk
confidence (minimum confidence).
Metodologi dasar analisis asosiasi terbagimenjadi dua tahap :
1. Analisa pola frekuensi tinggiTahap ini mencari kombinasi item
yang memenuhi syarat minimum dari
nilai support dalam database. Sebagaicontoh, ada database dari transaksi
belanja pasar swalayan seperti berikut :
ID
Transaksi
item terjual
1 Pena, roti, mentega
2 Roti, mentega, telur,
susu3 Buncis, telur, susu
4 Roti, mentega
5 Roti, mentega, kecap,
telur, susu
Syarat minimum dari nilai support untuk
pola frekuensi tinggi dalam contoh iniadalah 30%.
Diketahui bahwa jumlah transaksi yang
memuat {roti,mentega} ada 4 (support
80%), sedangkan jumlah transaksi yangmemuat {roti,mentega,susu} ada 2
(support 40%), transaksi yang memuat
{buncis} hanya 1 (support 20%) dsb.Sehingga diperoleh pola frekuensi tinggi
yang memenuhi syarat minimum nilai
support adalah :
Kombinasi item Support
{roti} 80%
{mentega} 80%
{telur} 60%{susu} 60%
{roti,mentega} 80%
{telur,susu} 60%
{roti,susu} 40%
{mentega,susu} 40%
{roti,telur} 40%
{mentega,telur} 40%
{roti,mentega,susu} 40%
{roti,mentega,telur,susu} 40%
2. Pembentukan aturan assosiatifSetelah semua pola frekuensi
tinggi ditemukan, barulah dicari aturanassosiatif yang memenuhi syarat
minimum untuk confidence dengan
menghitung confidence aturan assosiatifA->B. Dari support pola frekuensi tinggi
A dan B dengan menggunakan rumus
berikut : confidence(A->B) = support(B)
/ support (A U B)Disini A U B adalah union dari pola A
dan B
5/27/2018 Absen Jurnal Johan 2010 Ok
6/14
2010 - Johan Page 6
Bila syarat minimum untuk confidencedari contoh diatas adalah 50% maka salah
satu aturan assosiatif yang dapat
ditemukan adalah :
{telur,susu} -> {roti,mentega} dengannilai confidence 66.6% karena
support({roti,mentega})/support({roti,mentega,telur,susu}) = 40%/60% = 66.6%
Aturan assosiatif lain yang dapat
ditemukan diantaranya adalah :aturan assosiatif support confidence
{telur,susu} -> {roti,mentega} 40% 66.6%
{roti,mentega} -> {susu} 40% 50%
{mentega,susu} -> {roti} 40% 100%
Perlu dicatat bahwa tahap pertama untuk
mencari pola frekuensi tinggi biasanyapaling banyak menghabiskan waktu
III.METODE PENELITIAN3.1. Kerangka Kerja Penelitian
Kerangka kerja adalah merupakan
prosedur kegiatan, mulai dari awalsampai akhir dari tulisan tesis ini.
Kerangka kerja tersebut digambarkan
seperti berikut ini gambar 3 :
Gambar 3.1 Kerangka Kerja Penelitian
3.2. Data Generation
Metode pengumpulan dataadalah cara-cara dan prosedur yang
dilakukan dalam penelitian untuk
memperoleh data yang dibutuhkan.
Beberapa metode pengumpulan data yang
dilakukan dalam penelitian ini adalah
sebagai berikut :
a.Melakukan observasi dan kajiantentang data transaksi penjualan
toko mini market Lima Bintang.Kajian lapangan ini untuk
mengetahui secara langsung
permasalahan yang ada, sehinggadiharapkan penerapan disain dan
konsep analisa data market
menggunakan algoritma apriori
dapat dilakukan dengan tepat.b. Library Research (tinjauan
kepustakaan)
Library research (tinjauan
kepustakaan) dilakukan untukmengumpulkan informasi tentang
literature dan pedoman dalampenentuan hasil analisa data market
menggunakan algoritma apriori.
c. Laboratory Research(Penelitian Laboratorium)Penelitian laboratorium adalah
untuk pengujian data penentuan
hasil analisa data market yang telahdidapatkan dengan menggunakan
algoritma apriori
3.3. Penentuan Tujuan
Yang menjadi tujuan pada tesis iniuntuk menentukan hasil analisa data
market menggunakan algoritma apriori.
Setelah melakukan kajian, maka sasaranterakhir dari tesis ini adalah sebagai
berikut :
a. Mendisain suatu konsep penentuanhasil analisa data market denganmenggunakan algoritma apriori,sehingga dapat menemukan pola dari
data yang tersembunyi.
b. Memberikan kemudahan atau solusibagi pengambil keputusan dalam
menemukan produk-produk yang
sering dibeli bersamaan dari datatransaksi sehingga dapat
menempatkan produk yang sering
dibeli bersamaan kedalam suatu area
yang berdekatan, merancang tampilan
Data Generation
Literatur
Penentuan Tujuan
Analisa Data
Analisa data dengan algoritma apriori
Implementasi
Pembahasan Hasil
5/27/2018 Absen Jurnal Johan 2010 Ok
7/14
2010 - Johan Page 7
produk dikatalog, merancang kupondiskon dan lain-lain.
c. Hasil dari penelitian yang dilakukanini nantinya dapat diuji dengan
menggunakan software associationrule.
3.4. LiteraturLiteratur yang dimaksud disini
adalah literatur yang digunakan untuk
mendapatkan suatu cara atau proseduryang akan digunakan untuk menganalisa
data market menggunakan algoritma
apriori agar nantinya dapat diterima oleh
semua pihak yang membutuhkan.
Sumber literatur didapatkan daribuku-buku yang membahas tentang
teknik data mining, analisa data market,algoritma apriori dan jurnal-jurnal dari
web site (internet). Judul buku dan
alamat situs di internet yang dijadikan
sebagai sumber literatur, nantinyadilampirkan pada daftar pustaka di akhir
tesis ini.
Dari hasil studi literatur diketahui ada
penerapan apriori di bidang mini marketuntuk mengelompokkan barang
berdasarkan kecenderungan kemunculan
bersama dalam satu transaksi, juga datamining pada tabel absensi elektronik
untuk mendeteksi kecurangan absensi,
dan analisa keranjang pasar denganalgoritma hash-based pada data transaksi
penjualan apotek.
3.5. Analisa DataData-data yang sudah diperoleh padatahap pengumpulan data, akan dianalisis
pada bagian ini. Berdasarkan hasil kajian
literatur dan observasi lapangan, data
disusun dan dikelompokkan dalambentuk tabel multikriteria sederhana. Hal
ini dimaksudkan untuk mempermudah
dalam analisa dan proses penentuan hasilanalisa data market menggunakan
algoritma apriori.
3.6. Pengolahan Data DenganAlgoritma Apriori
Pada tahap ini akan dilakukan analisa
yaitu; analisa terhadap algoritma apriori
pada data market dari data transaksipenjualan untuk menentukan alternatif
yang terbaik dari sekumpulan alternatifyang ada melalui suatu proses seperti
yang terjadi pada proses yang terstruktur.
3.7. Implementasi
Pada penelitian ini penulis
mengimplementasikan pengujian modeldari hasil analisa data menggunakan
algoritma apriori dengan menggunakan
alat bantu komputer dengan operating
system windows dan menggunakansoftware shoping cart analyzer. Model
yang dirancang ini akan dibuat sebagai
sebuah aplikasi yang siap pakai.
3.8. Pembahasan Hasil
Evaluasi sistem yang telah di uji perlu
dilakukan, dengan tujuan untuk
mengetahui apakah sistem yang diujitersebut sudah sesuai dengan yang
diharapkan. Evaluasi dilakukan dengan
cara membandingkan hasil yangdidapatkan pada tahap implementasi
sistem dengan hasil yang dibuat secara
manual.
IV.ANALISA DAN PERANCANGANTahapan yang cukup penting pada
data mining adalah tahapan data
preparation atau tahapan persiapan data.
Dimana nantinya data yang didapatkanakan dipergunakan pada tahapan
selanjutnya yaitu modelling. Apabiladata yang didapatkan tidak benar makanantinya model yang dihasilkan tidak
akan maksimal hasilnya.
4.1 Data Preparation
Data yang didapatkan merupakandata primer yaitu data yang didapatkan
langsung dari data transaksi penjualan
toko mini market lima bintang pekanbaru,berupa data transaksi penjualan dalam
beberapa bulan.
5/27/2018 Absen Jurnal Johan 2010 Ok
8/14
2010 - Johan Page 8
Terdapat delapan(8) atribut yangharus diisi yang ada pada transaksi
penjualan toko mini market lima bintang
pekanbaru yaitu :
1.
TanggalKegiatan kapan terjadinya transaksi
2. No_NotaNomor kegiatan transaksi yang harus
diisi disaat transaksi terjadi
3. KonsumenNama pelanggan yang membeli itembarang
4. Nama_BarangPendefinisian item-item barang untukmembedakan item barang yang satu
dengan item barang yang lain.5. QTY6. Jumlah item barang yang dimasukkan
pelanggan ke dalam keranjang
belanjaanya.
7. SatuanBentuk item barang
8. Harga_Satuan(@)Harga per item barang yang dibeli
pelanggan9. JumlahHarga yang harus dibayar oleh
pelanggan
4.1.1 Select Data
Dari 8 atribut yang ada pada data
transaksi penjualan yang dapat dijadikan
parameter pada penelitian ini hanyaNo_Nota dan Nama_Barang. Dimana kita
hanya melihat item barang mana yang
sering dibeli oleh pelanggan.
5/27/2018 Absen Jurnal Johan 2010 Ok
9/14
2010 - Johan Page 9
Tabel 4.1 Data Transaksi Mini Market
Tanggal No_Nota Konsumen Nama Barang Qty Satuan Harga_Satuan(@) Jumlah
2-Jan-10 1704 Caf Bintang Indomie Goreng
Special
1 Dus Rp 49,000 Rp 49,000
2-Jan-10 1704 Caf Bintang Indomie Kari Ayam 5 Dus Rp 50,000 Rp 250,000
2-Jan-10
1704 Caf Bintang
Indomie Ayam
Bawang
2 Dus Rp 47,000 Rp 94,000
2-Jan-10 1704 Caf Bintang Indomie Soto Medan 2 Dus Rp 46,000 Rp 92,000
2-Jan-10 1704 Caf Bintang Indomie Kaldu Ayam 1 Dus Rp 46,000 Rp 46,000
2-Jan-10 1704 Caf Bintang Indomie Goreng Sate 1 Dus Rp 48,000 Rp 48,000
2-Jan-10 1704 Caf Bintang Indomie Goreng
Pedas
2 Dus Rp 48,000 Rp 96,000
2-Jan-10 1705Warung Restu Tepung Terigu
Tepung Terigu 2 Kg Rp 6,000 Rp 12,000
2-Jan-10 1705Warung Restu Tepung Terigu
Tepung Kanji 3 Kg Rp 5,500 Rp 16,500
2-Jan-10 1705Warung Restu Tepung Terigu
Super Bubur Rasa Sapi 1 Dus Rp 40,000 Rp 40,000
2-Jan-10 1705Warung Restu Tepung Terigu
ABC Mie Semur Pedas 2 Dus Rp 49,000 Rp 98,000
2-Jan-10 1705 Warung Restu Tepung TeriguRoyco Ayam Sachet2 Renceng Rp 6,000 Rp 12,000
2-Jan-10 1705 Warung Restu Tepung TeriguRoyco Sapi Sachet 2 Renceng Rp 6,000 Rp 12,000
2-Jan-10 1705 Warung Restu Tepung TeriguTelor Ayam2 Papan Rp 22,000 Rp 44,000
2-Jan-10 1706 Salon Van Beauty Air Galon SPA 1 Galon Rp 9,500 Rp 9,500
2-Jan-10 1706 Salon Van Beauty Aqua Cup 5 Dus Rp 15,000 Rp 75,000
2-Jan-10 1706 Salon Van Beauty Beras Belida 20Kg 5 Bgks Rp 80,000 Rp 400,000
2-Jan-10 1706 Salon Van Beauty Indomie Goreng
Pedas
5 Bgks Rp 48,000 Rp 240,000
2-Jan-10 1706 Salon Van Beauty Lifebuoy Cair 450ml 5 Bgks Rp 2,000 Rp 10,000
3-Jan-10 1707 Warung Wiwi Milo Sachet 10 Bgks Rp 2,500 Rp 25,000
3-Jan-10 1707 Warung Wiwi Kecap Manis Bango
Refill 85ml
5 Bgks Rp 8,000 Rp 40,000
3-Jan-10 1707 Warung Wiwi Roti Bobo 10 Bgks Rp 1,000 Rp 10,000
3-Jan-10 1707 Warung Wiwi Sampoerna Mild 16 5 Bgks Rp 10,000 Rp 50,000
3-Jan-10 1707 Warung Wiwi Lucky Strike Black 3 Bgks Rp 11,000 Rp 33,000
3-Jan-10 1708 Ridho Jaya Indomilk Susu Kental
Manis Coklat Kaleng
2 klg Rp 5,600 Rp 11,200
3-Jan-10 1708 Ridho Jaya Teh Celup Sari Wangi
@50sch
3 Bgks Rp 6,000 Rp 18,000
3-Jan-10 1708 Ridho Jaya Ajinomoto @500 2 Bgks Rp 7,500 Rp 15,000
3-Jan-10 1708 Ridho Jaya Rinso 900gr 2 Pack Rp 7,500 Rp 15,000
3-Jan-10 1708 Ridho Jaya Telor Ayam 1 Papan Rp 22,000 Rp 22,000
3-Jan-10 1709 MM Masakan
Medan
Roti Bobo 12 Bgks Rp 1,000 Rp 12,000
3-Jan-10 1709 MM Masakan
Medan
Daia Putih 1Kg 1 Kg Rp 18,000 Rp 18,000
3-Jan-10 1709 MM Masakan
Medan
Indomie Kari Ayam 2 Dus Rp 50,000 Rp 100,000
3-Jan-10 1709 MM Masakan
Medan
Indomie Goreng
Special
1 Dus Rp 49,000 Rp 49,000
3-Jan-10 1709 MM Masakan
Medan
Indomie Goreng
Pedas
1 Dus Rp 48,000 Rp 48,000
3-Jan-10 1710 Kedai Kopi Lin's ABC Mie Semur Pedas 2 Dus Rp 49,000 Rp 98,000
3-Jan-10 1710 Kedai Kopi Lin's Telor Ayam 3 Papan Rp 22,000 Rp 66,000
3-Jan-10 1710 Kedai Kopi Lin's Milo Sachet 6 Bgks Rp 2,500 Rp 15,000
3-Jan-10 1710 Kedai Kopi Lin's Indomie Soto Medan 3 Dus Rp 46,000 Rp 138,000
5/27/2018 Absen Jurnal Johan 2010 Ok
10/14
2010 - Johan Page 10
Support
4.1.2 Pembersihan Data
Pembersihan data biasanya
dipergunakan untuk mengisi data-data
yang masih kosong atau ada kesalahan
pengisian. Pada data mining ada teknik-teknik yang dapat dipergunakan untuk
melakukan pembersihan data. Akan tetapiuntuk penelitian ini, penulis tidak
mempergunakan teknik-teknik pada data
mining tersebut. Karena parameter-
parameter yang ada, dibutuhkan datayang sebenarnya, bukan data yang dibuat
berdasarkan rata-rata yang ada.
4.1.3 Integrasi Data
Data-data yang dikumpulkan
dalam proses transaksi seringkaliditempatkan pada lokasi yang berbeda-
beda. Maka dari itu dibutuhkankemampuan dari sistem untuk dapat
mengumpulkan data dengan cepat.
Tabel 4.2 Contoh Database
Transaksional
No_Fak
tur
Item Bought
1704 Indomie Goreng Special,Indomie Kari Ayam, Indomie
Ayam Bawang, Indomie Soto
Medan, Indomie Kaldu Ayam,Indomie Goreng Sate, Indomie
Goreng Pedas
1705 Tepung Terigu, Tepung Kanji,
Super Bubur Rasa Sapi, ABCMie Semur Pedas, Royco Ayam
Sachet, Royco Sapi Sachet,
Telor Ayam
1706 Air Galon SPA, Aqua Cup,Beras Belida 20Kg, IndomieGoreng Pedas, Lifebuoy Cair
450ml
1707 Milo Sachet, Kecap Manis
Bango Refill 85ml, Roti Bobo,
Sampoerna Mild 16, LuckyStrike Black
1708 Indomilk Susu Kental Manis
Coklat Kaleng, Teh Celup Sari
Wangi @50sch, Ajinomoto
@500, Rinso 900gr, Telor Ayam
1709 Roti Bobo, Daia Putih 1Kg,
Indomie Kari Ayam, Indomie
Goreng Special, Indomie Goreng
Pedas1710 ABC Mie Semur Pedas, Telor
Ayam, Milo Sachet, Indomie
Soto Medan
Dengan menggunakan tabel transaksi
diatas, akan ditunjukkan bagaimana carakerja dari algoritma apriori. Minimum
support(minsupp) yang ditetapkan untuk
menjalankan algoritma ini adalah sebesar20% , dikarenakan akan terjadi transaksi
dengan banyak item sehinggasupportnya
di kecilkan.
Langkah 1 : menelusuri seluruh recorddi basis data transaksi dan menghitung
support count dari tiap item. Ini adalah
kandidat 1-itemset, C1
Tabel 4.3 Candidat 1-itemsetC1
Candidate 1-i temsetSupport Frequen
t
Indomie Goreng
Special
2/7 (28,6%) Ya
Indomie Kari
Ayam
2/7 (28,6%) Ya
Indomie Soto
Medan
2/7 (28,6%) Ya
Roti Bobo 2/7 (28,6%) Ya
ABC Mie Semur
Pedas
2/7 (28,6%) Ya
Milo Sachet 2/7 (28,6%) Ya
Indomie GorengPedas
3/7 (42,8%) Ya
Telor Ayam 3/7 (42,8%) Ya
Indomie AyamBawang
1/7 (14,3%) Tidak
Indomie Kaldu
Ayam
1/7 (14,3%) Tidak
Indomie Goreng
Sate
1/7 (14,3%) Tidak
Jumlah Transaksi Mengandung A
Total Transaksi
5/27/2018 Absen Jurnal Johan 2010 Ok
11/14
2010 - Johan Page 11
Support
Support
Support =
Support =
Support =
Support =
Support =
Support =
Tepung Terigu 1/7 (14,3%) Tidak
Tepung Kanji 1/7 (14,3%) Tidak
Super Bubur Rasa
Sapi
1/7 (14,3%) Tidak
Royco AyamSachet
1/7 (14,3%) Tidak
Royco Sapi Sachet 1/7 (14,3%) Tidak
Air Galon SPA 1/7 (14,3%) Tidak
Aqua Cup 1/7 (14,3%) Tidak
Beras Belida 20Kg 1/7 (14,3%) Tidak
Lifebuoy Cair
450ml
1/7 (14,3%) Tidak
Kecap Manis
Bango Refill 85ml
1/7 (14,3%) Tidak
Sampoerna Mild
16
1/7 (14,3%) Tidak
Lucky Strike Black 1/7 (14,3%) Tidak
Indomilk Susu
Kental ManisCoklat Kaleng
1/7 (14,3%) Tidak
Teh Celup Sari
Wangi @50sch
1/7 (14,3%) Tidak
Ajinomoto @500 1/7 (14,3%) Tidak
Rinso 900gr 1/7 (14,3%) Tidak
Daia Putih 1Kg 1/7 (14,3%) Tidak
Adapun keterangan dari tabel 4.4 adalah
sebagai berikut.
Nilai Support Indomie Goreng Special
dapat dihitung dengan menggunakan
rumus, yaitu :
Support = 2 / 7 = 28,6 %
Nilai Support Indomie Kari Ayam
dapat dihitung dengan menggunakan
rumus, yaitu :
Support = 2 / 7 = 28,6 %
Nilai Support Indomie Soto Medan
dapat dihitung dengan menggunakan
rumus, yaitu :
Support = 2 / 7 = 28,6 %
Nilai Support Telor Ayam dapatdihitung dengan menggunakan rumus,
yaitu :
Support = 3 / 7 = 42,8 %
Langkah 2: large1_itemset L1 dibangundengan menyaring C1 (tabel 4.4) dengan
supportcountyang lebih besar atau samadengan minimum support untuk
dimasukkan ke dalam L1
Tabel 4.4 Frequent 1-i temset
L1
Frequent 1-I temset
Indomie Goreng Special 28,6 %
Indomie Kari Ayam 28,6 %
Indomie Soto Medan 28,6 %
Roti Bobo 28,6 %
ABC Mie Semur Pedas 28,6 %
Milo Sachet 28,6 %
Indomie Goreng Pedas 42,8 %
Telor Ayam 42,8 %
Jumlah Indomie Goreng Special
Total Transaksi
2
7
Jumlah Indomie Kari Ayam
Total Transaksi
2
7
Jumlah Indomie Soto Medan
Total Transaksi
2
7
Jumlah Telor Ayam
Total Transaksi
3
7
5/27/2018 Absen Jurnal Johan 2010 Ok
12/14
2010 - Johan Page 12
Support A,B,C = P(A BC)
Support =
Langkah 3 : untuk membangun L2,algoritma apriori menggunakan proses
join untuk menghasilkan C2.
Untuk candidat 2-itemset, dari 8 item
dapat menghasilkan kombinasi 2-itemset
yang memungkinkan sebanyak :
C82= = 28 kombinasi
Langkah 4 : dari C2 (tabel 4.6), 2-
itemset yang memiliki support count
yang lebih besar atau sama denganminimum support akan disimpan ke
dalam L2.
Tabel 4.5 Frequent 2-itemset
L2
Frequent 2-itemset
Indomie Goreng Special,Indomie Kari Ayam
28,6 %
Indomie Goreng Special,
Indomie Goreng Pedas
28,6 %
Indomie Kari Ayam, Indomie
Goreng Pedas
28,6 %
ABC Mie Semur Pedas, Telor
Ayam
28,6 %
Langkah 5 : proses ini diulang sampai
tidak ada lagi kemungkinan k-itemset
Untuk candidat 3-itemset, dari 4 item
dapat menghasilkan kombinasi 3-itemset
yang memungkinkan sebanyak :
C43= = 4kombinasi
Tabel 4.6 Candidat 3-itemset
C3
Candidate 3- itemset
Support Frequent
Indomie Goreng Special,
Indomie Kari Ayam,
2/7
(28,6%)
Ya
Indomie Goreng Pedas
Indomie Goreng Special,
Indomie Kari Ayam, ABC
Ayam Semur
0/7 (0%) Tidak
Indomie Goreng Special,
Indomie Kari Ayam, Telor
Ayam
0/7 (0%) Tidak
Indomie Kari Ayam,
Indomie Goreng Pedas,
Telor Ayam
0/7 (0%) Tidak
Adapun keterangan dari tabel 4.8 adalah
sebagai berikut.
Nilai Support Indomie Goreng Special,
Indomie Kari Ayam, Indomie Goreng
Pedas dapat dihitung dengan
menggunakan rumus, yaitu :
Support = 2 / 7 = 28,6 %
Tabel 4.7 frequent 3-itemset
Frequent 3-itemset
Indomie Goreng Special, Indomie
Kari Ayam, Indomie Goreng Pedas
28,6 %
Karena tidak memungkinkan lagi
dibentuk frequent4-itemset dari frequent
3-itemset, maka proses pencariandihentikan dan maximalfrequentitemset-
nya adalah {Indomie Goreng Special,
Indomie Kari Ayam, Indomie GorengPedas}. Untuk pembangkitan aturan
asosiasi dari Large itemset, harus
memenuhi minimum support danminimum confidence yang telah
ditentukan. Confidence dari setiap aturan
Jumlah transaksi Indomie Goreng Special AND
Indomie Kari Ayam AND Indomie Goreng Pedas
Total Transaksi
27
5/27/2018 Absen Jurnal Johan 2010 Ok
13/14
2010 - Johan Page 13
yang dibangkitkan dapat dihitung dengan
menggunakan rumus peluang :
Confidence (A B) = P (B/A) =support
count(A B)/supportcount (A), dengan
support count (A B) adalah jumlahtransaksi yang berisi itemset A dan B,
dan support count (A) adalah jumlah
transaksi yang berisi itemset A.Berdasarkan rumus diatas, aturan asosiasi
dapat dibangkitkan dengan langkah :
support count(l)/support count(s) =
minimum confidence.
4.2Pembangkitan Association RuleSetelah proses penghitungan
confidence selesai dilakukan maka kitadapat menghasilkan association rule
berdasarkan data yang ada. Sebagaicontoh akan dihasilkan association rule
dari 2 itemset seperti yang diperlihatkan
pada tabel 4.10 maka association rule
yang dihasilkan adalah sebagai berikut.
1. Jika konsumen membeli IndomieGoreng Special juga akan membeli
Indomie Kari Ayam , maka nilai
support = 28,6% dan nilai confidence= 100%
- item A dan B dibeli bersamaansebesar 28,6% dari keseluruhandata transaksi yang dianalisis dan
100% dari semua konsumen yang
membeli item A juga membeliitemB.
2. Jika konsumen membeli Roti Bobojuga akan membeli Indomie Goreng
Special, maka nilai support = 14,3%
dan nilai confidence = 50%3. Jika konsumen membeli Indomie
Soto Medan juga akan membeliIndomie Goreng Special, maka nilai
support = 14,3% dan nilai confidence
= 50%4. Jika konsumen membeli Indomie
Goreng Special juga akan membeli
Indomie Goreng Pedas, maka nilai
support = 14,3% dan nilai confidence= 100%
5. Jika konsumen membeli IndomieGoreng Pedas juga akan membeli
Indomie Goreng Special, maka nilai
support = 14,3% dan nilai confidence
= 66,7%6. Jika konsumen membeli IndomieKari Ayam juga akan membeliIndomie Goreng Pedas, maka nilai
support = 14,3% dan nilai confidence
= 66,7%
7. Jika konsumen membeli IndomieKari Ayam juga akan membeli
Indomie Soto Medan, maka nilai
support = 14,3% dan nilai confidence= 50%
8.
Jika konsumen membeli Roti Bobojuga akan membeli Indomie KariAyam, maka nilai support = 14,3%
dan nilai confidence = 50%
9. Jika konsumen membeli Telor Ayamjuga akan membeli Indomie Soto
Medan, maka nilai support = 14,3%
dan nilai confidence = 33,3%
10.Jika konsumen membeli Milo Sachetjuga akan membeli Telor Ayam,
maka nilai support = 14,3% dan nilai
confidence = 50%Sebagai contoh akan dihasilkan
association rule dari 3 itemset seperti
yang diperlihatkan pada tabel 4.8 makaassociation rule yang dihasilkan adalah
sebagai berikut.
- Jika Konsumen membeli IndomieGoreng Special juga akanmembeli Indomie Kari Ayam dan
juga akan membeli Indomie
Goreng Pedas, maka nilaisupport= 28,6% dan nilai confidence =
100%
ArtinyaitemA,B dan C dibeli bersamaansebesar 28,6% dari keseluruhan data
transaksi yang dianalisis dan 100% dari
semua konsumen yang membeli item Adan itemB juga membeli itemC.
5/27/2018 Absen Jurnal Johan 2010 Ok
14/14
2010 - Johan Page 14
V. KESIMPULAN DAN SARAN
5.1 Kesimpulan
Berdasarkan penelitian yang penulis
lakukan pada Toko Mini Market LimaBintang Pekanbaru, maka penulis dapat
menarik kesimpulan bahwa data transaksi
penjualan toko mini market Lima Bintang
Pekanbaru dapat ditambang dengan teknik
association rule dan menghasilkan rule-rule
yang bermanfaat bagi perusahaan.
Atas analisis dan pembahasan yangpenulis lakukan pada system analisa data
market maka penulis dapat mengambil
kesimpulan sebagai berikut:
1. Berdasarkan uji coba Nilai Supportdengan nilai support 0.25%, 0.5%.0.75%
dan 1 % dapat diambil kesimpulan bahwa
semakin kecil nilai support maka jumlah
itemset yang dihasilkan semakin banyak,
dan jumlah kaidah asosiasi yang dibentuk
semakin banyak pula.
2. Data transaksi sebaiknya diambil pada
periode-periode tertentu (misalnya awal
tahun, pertengahan tahun, akhir tahun),
sebab aturan-aturan yang dibangkitkan
pola pembelian pelanggan dapat berbedadari satu periode ke periode lainnya.
Aturan-aturan asosiasi yang dihasilkan
tidak selalu mengandung informasi yang
penting (karena sudah umum diketahui),
dan aturan yang berharga adalah yang
berupa informasi baru yang dapat
dimanfaatkan untuk meningkatkan
penjualan.
5.2 Saran
Dari hasil pembahasan ini, makapenulis dapat menyampaikan saran-saran
sebagai berikut:
1. Agar perusahaan dapat memanfaatkan
gudang data mereka untuk informasi
dalam dunia bisnis,
2. Informasi yang ditemukan sebaiknya dapat
diaplikasikan untuk aplikasi manajemen
dan pengambilan keputusan.
DAFTAR PUSTAKA
[1] Gregorius Satia Budhi; Felicia Soedjianto
(2007) APLIKASI DATA MINING
MARKET BASKET ANALYSIS PADA
TABEL DATA ABSENSI
ELEKTRONIK UNTUK MENDETEKSI
KECURANGAN ABSENSI (CHECK-LOCK) KARYAWAN DI
PERUSAHAAN. Jurnal Teknik
Informatika, Fakultas Teknologi Industri,
Universitas Kristen Petra, Surabaya.
[2] Gregorius S. Budhi, Resmana Lim (2005)
PENGGUNAAN METODE FUZZY c-
COVERING UNTUK ANALISA
MARKET BASKET PADASUPERMARKET. Jurnal Teknik
Informatika, Universitas Kristen Petra,Surabaya.
[3] Hwung Su J., Yang Lin W. 2004, CBW:
An Efficient Algorithm for Frequent
Itemset Mining. Proceedings of the 37th
Hawaii International Conference on
System Sciences.[4] Iko Pramudiono (2003), Pengantar Data
Mining Menambang Permata
Pengetahuan di Gunung Data. Ilmu
komputer.com1-4
[5] Marsela Yulitadan Veronica S. Moertini
(2004) ANALISIS KERANJANGPASAR DENGAN ALGORITMA
HASH-BASED PADA DATATRANSAKSI PENJUALAN APOTEK.
Jurnal Ilmu Komputer, Universitas
Katolik Parahyangan, Bandung.
[6] Mewati Ayub (2007) Proses Data
Mining dalam Sistem Pembelajaran
Berbantuan Komputer. Jurnal Sistem
Informasi Vol. 2 No.1.[7] Philips Kokoh Prasetyo (2006) Data
Mining & Knowledge Discovery.
https://philips.wordpress.com/2006/06/22/association-rule-mining.
[8] Ravindra Patel, D. K. Swami and K. R.
Pardasani (2006) Lattice Based
Algorithm for Incremental Mining of
Association Rules. InternationalJournal of Theoretical and Applied
Computer Sciences.
[9] Veronika S. Moertini (2002) DATAMINING SEBAGAI SOLUSI
BISNIS. vol. 7 no.1.