Analisis Per Banding An Algoritma Apriori Dan Min

download Analisis Per Banding An Algoritma Apriori Dan Min

If you can't read please download the document

Transcript of Analisis Per Banding An Algoritma Apriori Dan Min

ANALISIS PERBANDINGAN ALGORITMA APRIORI DAN MIN-APRIORI UNTUK IMPLEMENTASI CLUSTERING BERDASARKAN HIPERGRAF RULE ASOSIASI COMPARISON ANALYSIS OF APRIORI AND MIN-APRIORI ALGORITHM FOR CLUSTERING BASED ON ASOSIATION RULE HYPERGRAPH IMPLEMENTATION Dyah Ayu Prewitaningsih1123

Moh.Arif Bijaksana,ST,MT2

Dhinta Darmantoro,ST,MSCS3

Jurusan Teknik Informatika Sekolah Tinggi Teknologi Telkom Jl. Radio Palasari, Dayeuh Kolot Bandung 40257 Indonesia [email protected] ABSTRAK [email protected]

[email protected]

Pada tugas akhir ini dilakukan analisis mengenai algoritma rule asosiasi apriori dan min-apriori. Salah satu hal mendasar yang membedakan kedua algoritma ini ialah dilakukannya diskritisasi terhadap atribut-atribut kontinus dalam menjalankan algoritma apriori, sedang pada algoritma min-apriori diskritisasi tersebut tidak dilakukan. Tujuan dari analisis ini ialah untuk membandingkan performansi asosiasi antar item yang dihasilkan oleh kedua algoritma. Clustering berdasarkan hipergraf rule asosiasi dapat diterapkan untuk mengetahui performansi asosiasi tersebut atau mengetahui algoritma rule asosiasi yang memiliki aplikabilitas lebih baik terhadap proses clustering. Dalam hal ini, algoritma pemartisi hipergraf yang digunakan adalah algoritma HMETIS. Frequent itemset dan rule asosiasi dari masingmasing algoritma asosiasi digunakan untuk membangun hipergraf input bagi algoritma clustering. Tentunya hipergraf input dengan relasi-relasi itemnya yang baik akan menghasilkan cluster-cluster output yang baik pula. Oleh karena itu, sebagai media bantu kegiatan analisis ini, dibangun sebuah perangkat lunak untuk mensimulasikan jalannya proses pembangkitan rule asosiasi, pembangunan hipergraf berdasarkan rule asosiasi, dan clustering hipergraf. Data set yang dipergunakan adalah data dengan tipe atribut kontinus, yaitu data teks dokumen web. Kata kunci: data mining, clustering, hipergraf, rule asosiasi, dokumen web, algoritma apriori, algoritma min-apriori. ABSTRACTION This final duty, conducted an analysis about rule association algorithms, apriori and min-apriori. One of base matter differentiating both algorithms is discretion conducted to continuous attributes in running apriori algorithm, while its not done in running min-apriori algorithm. The intention of this analysis is to compare association performance among items yielded by both algorithms. Clustering based on rule association hypergraph can be used to know this association performance or know rule association algorithm with better applicability for the clustering process. In this case, hypergraph partitioning algorithm that being used is HMETIS algorithm. Frequent itemset and rule association yielded from each association algorithm used to develop input hypergraph for clustering algorithm. Naturally, a good input hypergraph with its good item relations will also yield good clusters. Therefore, software, as assistive media for this analysis activity, is developed for simulating the evocation of rule association, hypergraph based on rule association development, and hypergraph clustering processes. Data set that being utilized is data with continuous attributes, which is text data of web documents. Keyword: data mining, clustering, hypergraph, rule association, web document, apriori algorithm, min-apriori algorithm. I. PENDAHULUAN 1.1 LATAR BELAKANG MASALAH Proses mining rule asosiasi bertujuan untuk menemukan frequent patterns, asosiasi, korelasi, dan struktur kausal antar item dalam sebuah data set. Hal-hal tersebut dapat merepresentasikan informasi penting yang ingin diketahui pada data yang diberikan. Mining rule asosiasi terdiri dari dua langkah proses, yaitu dengan menemukan semua frequent item set dan dilanjutkan dengan membangkitkan rule asosiasi yang kuat dari frequent item set tersebut [9]. Di antara beberapa algoritma rule asosiasi yang dikembangkan, algoritma apriori merupakan algoritma yang dinilai paling efisien [4]. Akan tetapi, algoritma ini pada dasarnya dirancang untuk data transaksional, sehingga dalam menjalankannya perlu dilakukan diskritisasi, yaitu perubahan ke dalam bentuk biner, pada atribut-atribut kontinus. Diskritisasi ini diduga menyebabkan distorsi yang mempengaruhi performansi asosiasi antar item [6], sehingga beberapa informasi penting dari data akan hilang. Maka, dikembangkan algoritma min-apriori yang khusus ditujukan untuk mining rule asosiasi pada data dengan atribut kontinus [5]. Salah satu cara untuk membuktikan keberadaan distorsi itu, dapat dilakukan dengan mengimplementasikan rule-rule yang dibangun dari frequent itemset algoritma apriori dan min-apriori tersebut pada clustering

berdasarkan hipergraf asosiasi. Rule asosiasi tersebut akan dijadikan dasar untuk membangun hipergraf input bagi algoritma clustering. Apabila informasi penting dari data masih dapat direpresentasikan dalam hipergraf input tersebut maka cluster-cluster output juga masih merepresentasikan informasi tersebut. Berdasarkan permasalahan di atas, maka pada tugas akhir ini akan dilakukan analisa perbandingan performansi asosiasi antar item yang dihasilkan oleh algoritma apriori dan min-apriori untuk implementasi clustering berdasarkan hipergraf rule asosiasi. 1.2 PERUMUSAN MASALAH Berdasarkan latar belakang di atas maka permasalahan yang akan diteliti ialah menganalisis perbandingan performansi asosiasi yang dihasilkan oleh algoritma apriori dan min-apriori untuk implementasi clustering berdasarkan hipergraf rule asosiasi. Data set yang digunakan adalah data set yang bertipe kontinus, terkait dengan isu diskritisasi yang telah disebutkan dalam sub bab latar belakang. Analisa dilakukan terhadap cluster-cluster akhir, yaitu dengan menghitung nilai entropy cluster-nya untuk menentukan kualitas clustering. 1.3 TUJUAN PEMBAHASAN Dengan tugas akhir ini, diharapkan akan diperoleh hal-hal sebagai berikut: 1. Mempelajari dan mendalami tentang algoritma apriori, algoritma min-apriori, pembangkitan frequent itemset pada data dengan atribut kontinus, pembangunan hipergraf rule asosiasi, dan clustering berdasarkan hipergraf rule asosiasi. 2. Mengetahui pengaruh diskritisasi pada atribut kontinus terhadap kualitas performansi asosiasi antar item. 3. Melakukan analisis perbandingan performansi asosiasi antar item yang dihasilkan oleh algoritma apriori dan min-apriori untuk implementasi clustering berdasarkan hipergraf rule asosiasi pada data dengan atribut kontinus. 1.4 BATASAN MASALAH Batasan masalah tugas akhir ini ialah : 1. Data set yang digunakan, yaitu data teks dokumen web berbahasa Inggris yang telah dikelompokkan oleh situs web dan telah ditabelkan. Sebelum ditabelkan, kata-kata yang terdapat pada teks dokumen tersebut telah mengalami proses data preprocessing. 2. Clustering yang dilakukan berupa pengelompokkan dokumen-dokumen dan pengelompokkan kata-kata yang dikandung oleh dokumen-dokumen tersebut. 3. Partisi hipergraf dilakukan dengan menggunakan fasilitas library algoritma HMETIS.

1.5 METODE PENYELESAIAN MASALAH Metode penyelesaian tugas akhir ini ialah : 1. Studi literatur, yang mempelajari literatur-literatur yang berhubungan dengan data mining, clustering, partisi hipergraf, rule asosiasi, dokumen web, algoritma apriori, algoritma minapriori. 2. Pengumpulan dan pengolahan data, dengan melakukan download data teks dokumen web berbahasa Inggris yang telah dikelompokkan oleh situs web, kemudian dilakukan data preprocessing, pemberian label kategori dokumen, dan penyimpanan data dalam tabel. 3. Pembuatan perangkat lunak untuk simulasi proses pembangkitan rule asosiasi, pembangunan hipergraf berdasarkan rule asosiasi, dan clustering hipergraf. 4. Melakukan analisis performansi asosiasi algoritma apriori dan min-apriori dengan menganalisa jumlah entropy cluster-cluster akhir dari proses simulasi. 5. Pengambilan kesimpulan. II. LANDASAN TEORI 2.1 Data Dokumen Basis data teks dokumen terdiri dari sekumpulan besar dokumen-dokumen yang dapat berasal dari berbagai macam sumber, seperti artikel berita, buku, paper penelitian, digital libraries, e-mail, dan halaman web [9]. Setiap dokumen terdiri dari sekumpulan kata-kata. Pada tahap teks analisis, dilakukan preprocessing terhadap data teks tersebut ekstraksi ciri terhadap kata-kata tersebut sehingga dapat dihasilkan ketepatan dan hasil yang berguna [12]. Ambiguitas dan kata-kata yang tidak relevan akan dihilangkan, selanjutnya seluruh kata-kata dalam seluruh dokumen akan transformasi ke dalam sebuah matriks. Apabila terdapat dataset yang terdiri dari sejumlah d dokumen dan sejumlah t terms/words, maka setiap dokumen tersebut akan dimodelkan sebagai sebuah vektor v dalam t dimentional space Rt. Koordinat ke-j dari v adalah angka yang dihitung dari asosiasi term ke-j dengan dokumen yang diberikan (umumnya didefinisikan sebagai 0 jika dokumen tersebut tidak mengandung term tersebut, dan nonzero jika kebalikannya). Terdapat banyak cara untuk mendefinisikan term-weighting dari nonzero entries dalam vektor tersebut. Contohnya ialah mendefinisikan vj=1 selama term ke-j muncul dalam dokumen, atau term frequency, yaitu jumlah dari kemunculan term ti dalam sebuah dokumen, atau relative term frequency, yaitu term frequency dibanding jumlah total kemunculan semua term dalam dokumen tersebut.

2

Gambar 2.1 Term frequency matrix

2.2

Pengertian Rule Asosiasi Rule asosiasi menunjukkan kondisi-kondisi atributnilai yang sering muncul bersama-sama dalam sebuah dataset yang diberikan[9]. Misalkan, T adalah kumpulan dari transaksi-transaksi dalam dataset dan setiap transaksi adalah subset dari kumpulan item-item(item-set) I. Sebuah rule asosiasi ialah sebuah implikasi dari bentuk , di mana , , dan [1]. Nilai support s didefinisikan sebagai probabilitas bahwa suatu transaksi dalam T mengandung {X,Y}, . Nilai confidende didefinisikan sebagai probabilitas kondisional yaitu frekuensi kemunculan {Y} pada transaksi yang mengandung {X}, . Tujuan dari dilakukannya proses mining rule asosiasi ialah menemukan semua rule yang memiliki hubungan asosiasi yang kuat, yaitu jika mempunyai nilai s nilai minimal support (minsup) dan mempunyai nilai confi-dence-nya nilai minimal confidence (minconf). 2.3 Algoritma Apriori Inti dari algoritma apriori adalah membangkitkan frequent itemset. Prinsipnya ialah semua subset yang bukan himpunan kosong dari sebuah frequent itemset pasti frequent juga. Jika itemset I tidak memenuhi minsup, maka I tidak frequent, P(I) {doc2,doc3} akan diinterpretasikan sebagai rule implikasi, informasi ini akan ditangkap oleh A=>B dan A=>C. Contoh dari pembobotan hiperedge tersebut adalah sebagai berikut : Misalkan, diberikan frequent itemset {doc1, doc2, doc3}, hipergraf akan berisi sebuah hiperedge yang menghubungkan doc1, doc2, dan doc3. Essential rule untuk itemset {doc1, doc2, doc3}: {doc1,doc2} => {doc3}, {doc1,doc3} => {doc2}, {doc2,doc3} => {doc1}. Maka, bobot yang diberikan pada hiperedge tersebut adalah 0,6 . Selanjutnya, hipergraf tersebut disebut dengan hipergraf rule asosiasi. 2.6 Clustering pada Data Dokumen Web

4

Gambar 2.5 Fase-fase dari multilevel graph bisection.

Selanjutnya, dikembangkan pula sebuah skema multi-phase refinement yang baru yang disebut vandVcycle refinement [10]. Ide yang dibalik algo-ritma refinement ini adalah untuk menggunakan kemam-puan dari paradigma multilevel guna memperbaiki kualitas dari bisection. 2.8 Fungsi Fitness dan Fungsi Connectivity Salah satu kelemahan HMETIS yaitu membutuhkan jumlah dari k partisi yang dispesifikasikan langsung oleh user. Salah satu cara pemecahan masalah ini adalah dengan mendefinisikan fungsi fitness pada hipergraf dan menghentikan pemartisian apabila fitness dari semua cluster memenuhi nilai threshold fitness [4]. Dalam tugas akhir ini, algoritma HMETIS dipergunakan untuk memartisi hipergraf dengan balanced 2-way partitions. Setelah hipergraf dipartisi menjadi 2 bagian, lalu dilakukan eliminasi terhadap cluster yang buruk menggunakan kriteria fitness cluster [6]. Fungsi perhitungan nilai fitness sebagai berikut :

dokumen [7]. Jika diketahui CS adalah sebuah solusi clustering dalam m cluster. Untuk setiap cluster, distribusi kelas dari data dihitung terlebih dahulu. Lalu menggunakan distribusi kelas ini, entropy dari setiap cluster j dihitung dengan formula : , di mana adalah pecahan dari data dalam cluster dengan label kelas Ci, dan jumlahnya diliputi seluruh kelas, C1, C2, ... ,Ck. Ketika sebuah cluster mengandung dokumen-dokumen yang hanya berasal dari satu kelas, nilai entropy cluster-nya adalah 0,00 dan ketika sebuah cluster terdiri atas dokumen-dokumen yang berasal dari berbagai kelas, maka nilai entropy cluster-nya akan lebih tinggi. Kemudian total entropy dihitung sebagai jumlah dari entropi cluster-cluster yang diboboti oleh ukuran dari tiap cluster. Formulanya adalah sebagai berikut : , di mana nj ialah ukuran dari cluster j dan n ialah jumlah total dari vertex-vertex [8]. III. PERANCANGAN PERANGKAT LUNAK SIMULASI 3.1 Format Data 3.1.1 Data Input Algoritma Rule Asosiasi Data input ini berupa tabel atau matriks(i,j), di mana untuk clustering dokumen baris (i) merepresentasikan kata dan baris (j) merepresentasikan dokumen, sedangkan untuk clustering kata baris (i) merepresentasikan dokumen dan kolom (j) merepresentasikan kata. Karena algoritma apriori hanya bekerja dengan data biner, maka perlu dilakukan pengubahan terhadap tabel yang orisinil menjadi sebuah tabel biner (0/1). Sedangkan pada algoritma min-apriori, diskritisasi ini tidak dilakukan. 3.1.2 Data Output Algoritma Rule Asosiasi Data output ini berupa array yang berisi frequent itemsets dan nilai supportnya. 3.1.3 Data Input Algoritma HMETIS Data input ini merepresentasikan hipergraf rule asosiasi yang akan diproses oleh package algoritma HMETIS. Setiap hiperedge memiliki nilai bobot. Setiap vertex vi (i =1,2,..,n) dalam V diberi label nomor, dimulai dari angka 0 sampai dengan (n-1). Sebagai ilustrasi pemodelan hipergraf, digambarkan pada gambar 3.1. Variabel-variabel yang diperlukan dalam memodelkan hipergraf [11] tersebut terdiri atas : i.nvtxs, nhedges : Jumlah dari vertex-vertex dan jumlah dari hiperedge dalam hipergraf. ii.eptr, eind : Dua array yang digunakan untuk

e ialah himpunan vertex yang merepresentasikan sebuah hiperedge dan C adalah himpunan vertex yang mereprestasikan sebuah partisi. Partisi yang memiliki fitness-nya > threshold fitness diyakini sebagai cluster yang baik dan akan disimpan sebagai cluster hasil awal. Setelah itu dilakukan pemeriksaan untuk memfilter vertex-vertex yang tidak terhubung cukup baik pada keseluruhan vertex yang ada pada partisi tersebut. Fungsi perhitungan konektifitas [4] tersebut adalah sebagai berikut:

Besarnya nilai connectivity menunjukkan bahwa vertex memiliki banyak edge yang menghubungkan proporsi yang baik dari vertex-vertex yang ada dalam partisi. Vertex yang connectivity-nya > threshold connectivity diya-kini sebagai vertex yang keterhubungan baik dalam partisi. 2.9 Entropy Untuk menghitung kualitas dari cluster-cluster final secara obyektif dapat mempergunakan perhitungan entropy. Entropy yang paling baik dihasilkan ketika setiap cluster yang ada mengandung tepat satu jenis kategori

5

mendiskripsikan hiperedge dalam hipergraf. Array eptr berukuran nhedges+1, digunakan untuk peng-indexkan array eind yang menyimpan hiperedge aktual. Setiap hiperedge disimpan sebagai sekuen dari vertexvertex yang merentang dalam urutan lokasi eind. Secara spesifik, hiperedge ke-i disimpan dengan dimulai pada lokasi eind[eptr[i ]] sampai (tetapi tidak termasuk) eind[eptr[i +1]]. iii.hewgts : Sebuah array seukuran dengan nhedges yang menyimpan bobot dari hiperedge. Bobot dari hiperedge i disimpan pada lokasi hewgts[i ].

untuk menentukan skema yang digunakan V-cycle refinement. option[5] untuk menentukan skema rekonstruksi hiperedge selama recursive bisection. option[6] bernilai 1, yang mengindikasikan bahwa ada sekumpulan vertex yang perlu di-pre-assign. option[7] bernilai -1, secara random dibangkitkan seed untuk menginisialisasi generator angka random dari HMETIS. option[8] bernilai 0, untuk menentukan tingkat informasi debug secara default. iv.part : array seukuran nvtxs yang mengembalikan patisi yang dihasilkan. v.edgecut : mengembalikan jumlah hiperedge yang dipotong oleh algoritma. 3.1.3 Data Output Algoritma Clustering Data output ini berupa array dari cluster-cluster yang dihasilkan, yang di dalam lokasi tiap array cluster tersebut terdapat array daftar dokumen yang dicakupnya. 3.2 Penentuan Kualitas Cluster Akhir 3.2.1 Cluster Dokumen Seperti yang telah dibahas pada bab sebelumnya, penentuan kualitas ini dapat mempergunakan perhitungan entropy pada tiap cluster. Kemudian dihitung total entropy cluster akhir yang merepresentasikan kualitas keseluruhan hasil clustering. 3.2.2 Cluster Kata-kata Dalam hal ini, cluster yang ukurannya kurang dari 5 tidak memiliki cukup kata-kata untuk menunjukkan trend apapun, sedangkan cluster dengan ukuran lebih besar dari 20 memiliki terlalu banyak katakata untuk dapat menunjukkan suatu trend [6]. Untuk menangkap trend yang direpresentasikan oleh kata antara kata-kata dalam satu partisi dapat dilihat dari label / kelas dokumen-dokumen yang memuat katakata tersebut. Semakin sedikit perbedaan label dokumen tersebut maka semakin mudah untuk menentukan trendnya. Oleh karena itu, dalam tugas akhir ini setiap kata dalam cluster akan dicari dokumen yang memuatnya, setelah itu dilakukan perhitungan entropy terhadap kumpulan dokumen tersebut, seperti pada cluster dokumen. 3.3 Diagram Alur Simulasi Proses-proses yang dilakukan untuk mendapatkan cluster-cluster akhir digambarkan pada diagram alur simulasi berikut :

Gambar 3.1. Pemodelan hipergraf dengan pembobotan hiperedge.

Variabel yang dipergunakan untuk clustering dengan package library HMETIS [11]: i.nparts : jumlah partisi yang diinginkan, dalam tugas akhir ini adalah 2. ii.ubfactor : digunakan untuk menentukan batas ketidakseimbangan vertex antara partisi selama recursive bisection. iii.options : array 9 integer yang digunakan untuk melewatkan parameter dari fase-fase algoritma. option[0] untuk men-set parameter default. option[1] untuk menentukan jumlah bisection yang diperhitungkan untuk setiap langkah bisection dalam algoritma. option[2] untuk skema yang digunakan dalam mengelompokkan vertex selama fase coarsening. option[3] menentukan skema refinement untuk fase uncoarsening. option[4]

6

Dataset_Libnama_dataset, min_sup nama_dataset, min_sup dataset dataset

Userentropy_apriori, entropy_minap, kelayakan_clust_word

1. Pencarian Frequent Item set dengan Apriori

2. Pencarian Frequent Item set dengan Min-Apriori

label_dokumen, jns_dataset, dataset

5. Penghitungan Entropy

cluster_akhir_apriori, cluster_akhir_minap freq_is_apriori freq_is_minap

D ata_Frequent_ISfreq_is_apriori, freq_is_minap

fit_threshold, con_threshold, clust_mode cluster_akhir_apriori, cluster_akhir_minap

freq_is_apriori, freq_is_minap

3. Pem bangunan Hipergraf

hpg_apriori, hpg_minap

4. Clusteringlabel_dokumen

partisi_fail_apriori, partisi_fail_minap weighted_hpe_apriori, Data_W eighted_H pe weighted_hpe_minap vcode_apriori, vcode_minap

weighted_hpe_apriori, weighted_hpe_minap vcode_apriori, vcode_minap

Data_Pengkodean

Gambar 3.4 DAD Level 1 Gambar 3.2 Diagram Alur Simulasi

VI. KESIMPULAN SEMENTARA Kesimpulan yang diambil dari kegiatan studi literatur yang telah dilakukan adalah : i.Performansi asosiasi dari essential rule yang dihasilkan dari frequent itemset algoritma min-apriori lebih baik daripada algoritma apriori. ii.Jumlah entropy cluster yang lebih rendah dapat merepresentasikan performansi asoiasi rule yang lebih baik. VII. DAFTAR PUSTAKADa ta se t_ L ib

Analisa dilakukan ketika cluster-cluster akhir dari proses clustering dihasilkan, yaitu terhadap jumlah entropy cluster-nya. 3.4 Perancangan Pada bagian ini akan membahas analisa dan perancangan sistem. 3.4.1 Diagram Konteksc l us te r_apr ior i _ak hi r, c l us ter_m in ap_ak h ir, entr opy _ap ri or i, e ntrop y _m in ap

U s ernam a _datas et, m in _s up, fit_thres hol d, c o n_th re s hol d, c lus t_m od e

Siste m Sim ulasi C lustering Berdasarkan H ip ergraf Ru le Asosiasi

data s et, lab el_ dok um en , jn s _datas et

Gambar 3.3 Diagram Konteks

3.4.2

DAD Level 1

1] Agrawal, Rakesh dan R. Srikant. 1994, Fast algorithms for mining association rules. Santiago, Chile : In Proc. of the 20th VLDB Conference, pages 487499. 2] Agrawal, Rakesh dan Roberto J. Bayardo Jr.1999, Mining the Most Interesting Rules, San Diego CA USA : ACM, KDD-99. 3] CSci 980 : Data Mining. Lecture 2 :Data. 4] Han, Eui-Hong, George Karypis, Vipin Kumar, Bamshad Mobasher. 1997, Clustering Based On Association Rule Hypergraphs, USA : Departement of Computer Science University of Minnesota Minneapolis. 5] Han, Eui-Hong, George Karypis, Vipin Kumar. 1997, Min-Apriori : An Algorithm for Finding Association Rules in Data with Continuous Attributes, USA: Departement of Computer Science and Engineering / Army HPC Researh Center University of Minnesota Minneapolis. 6] Han, Eui-Hong, George Karypis, Vipin Kumar, Bamshad Mobasher. Clustering in HighDimentional Space Using Hypergraph Model, USA: Departement of Computer Science and Engineering/Army HPC Researh Center

7

University of Minnesota Minneapolis. 7] Han, Eui-Hong(Sam), dkk. WebACE : A Web Agent for Document Categorization and Exploration, USA: Department of Computer Science and Engineering University of Minnesota. 8] Han, Eui-Hong, George Karypis, Vipin Kumar. 1999, Multilevel Refinement for Hierarcical Clustering, USA: Departement of Computer Science and Engineering / Army HPC Researh Center University of Minnesota Minneapolis. 9] Han, Jiawei, Micheline Kamber, 2001. Data Mining Concepts and Techniques, USA: Academic Press. 10] Karypis, G., R. Aggarwal, V. Kumar, and S. Shekhar. 1996, Hypergraph partitioning: Applications in VLSI domain. Technical Report

TR-96-060, USA: Departement of Computer Science University of Minnesota Minneapolis. 11] Karypis, George dan Vipin Kumar, 1998. hMeTis : A Hypergraph Partition Package Version 1.5.3, USA: Departement of Computer Science University of Minnesota Minneapolis. 12] Parmawati, Lisa. 2005, Penerapan Text Mining untuk Klasifikasi Jurnal TA Menggunakan Decision Tree, Bandung: Jurusan Teknik Informatika Sekolah Tinggi Teknologi Telkom. 13] Trifunovic, Aleksandar dan William J. Knottenbelt. 2004, A Parallel Algorithm for Multilevel k-way Hypergraph Partitioning, London: Department of Computing, Imperial College London South Kensington Campus.

8