Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma...

44
Algoritma Klasifikasi Amil Ahmad Ilham

Transcript of Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma...

Page 1: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Algoritma KlasifikasiAmil Ahmad Ilham

Page 2: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Algoritma Data Mining (DM)

1. Estimation (Estimasi): β€’ Linear Regression, Neural Network, Support Vector Machine, etc

2. Prediction/Forecasting (Prediksi/Peramalan): β€’ Linear Regression, Neural Network, Support Vector Machine, etc

3. Classification (Klasifikasi): β€’ Naive Bayes, K-Nearest Neighbor, C4.5, ID3, CART, Linear Discriminant Analysis, Logistic Regression, etc

4. Clustering (Klastering): β€’ K-Means, K-Medoids, Self-Organizing Map (SOM), Fuzzy C-Means, etc

5. Association (Asosiasi): β€’ FP-Growth, A Priori, Coefficient of Correlation, Chi Square, etc

Page 3: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Classification (Klasifikasi)

β€’ Supervised Learning

β€’ Pembelajaran pada data pelatihan yang mempunyaiinformasi label kelas (labeled data)

3

Labeled DataLearning Process Mod

el

Data Kelas

Citra 1 Mobil

Citra 2 Sepeda

Citra 3 Mobil

… …

Citra N Sepeda

Page 4: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Clustering (Klastering)

β€’ Unsupervised Learning

β€’ Pembelajaran pada data pelatihan tanpa ada informasi label kelas (unlabeled data)

4

Data Label

Citra 1 Kelompok 1

Citra 2 Kelompok 2

Citra 3 Kelompok 1

… …

Citra N Kelompok k

Unlabeled Data

Data Label

Citra 1 ?

Citra 2 ?

Citra 3 ?

… …

Citra N ?

Model

Similarity Process

Centroids

Centroid 1

Centroid 2

…

Centroid k

Labeled Data

Page 5: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Classification (Klasifikasi)

β€’ Supervised using labelled datasets

5

Page 6: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Clustering (Klastering)

β€’ Unsupervised using unlabelled datasets

6

Page 7: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Clustering Vs. Classification

7

Page 8: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

KlasifikasiKlasifikasi

Page 9: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Apa Tugasnya Klasifikasi?β€’ Diberikan sebuah himpunan observasi berupa data tabel, lengkap dengan

label class-nya,

β€’ Klasifikasi harus menentukkan class dari observasi baru yang belumdiberikan label class.

9

Data berupaKategori

Page 10: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Contoh Kasus Klasifikasiβ€’ Sebuah bank harus menentukan apakah salah satu nasabahnya yang ingin

melakukan peminjaman uang dapat mengembalikan pinjamannya atautidak.

β€’ Yang bisa dilakukan bank ialah menganalisa data nasabah sebelumnya, nasabah dengan ciri-ciri seperti apa yang kemungkinan memiliki masalahdalam melakukan pengembalian pinjaman.

β€’ Ciri-ciri yang dimaksud adalah informasi yang dimiliki nasabah, seperti:β€’ Umur, edukasi, lama bekerja, pendapatan, debit yang dimiliki, dll.

10

Page 11: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Contoh Kasus Klasifikasi

β€’ Berdasarkan informasi-informasi tersebut, sebuah classifier model dapatdibuat yang akan digunakan untuk melakukan klasifikasi data baru!

β€’ Jika nasabah baru muncul, classifier model dapat melakukan kategorisasinasabah tersebut.

11

Classifier model

Modelling

Input

Kategorisasi

0

Page 12: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Target / Class dari Klasifikasi

β€’ Dari contoh yang sebelumnya, terlihat bahwa target / class dari nasabahtersebut berupa binaryβ€’ Memungkinkan melakukan pinjamanβ€’ Tidak memungkinkan melakukan pinjaman

β€’ Pada dasarnya, klasifikasi tidak hanya dapat melakukan binary classificationtetapi juga multiclass classification.

β€’ Sebagai contoh:β€’ Kelompok A, atau B, atau C.β€’ Kucing, Harimau, atau Macanβ€’ Bunga anggrek, melati, atau bakung.

12

Page 13: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Contoh Multiclass Classification

β€’ Terdapat data pasien yang mengalami sebuah penyakit yang sama.

β€’ Namun karena kondisi tubuh pasien tersebut berbeda-beda, obat yang dianjurkan oleh dokterpun harus sesuai dengan kondisi tubuhnya.

β€’ Ada tiga tipe obat yang tersedia: drugC, drugX, dan drugY.

13

Page 14: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Contoh Multiclass Classification

β€’ Classifier model dapat dibuat berdasarkan data pasien yang tersedia.

β€’ Jika pasien baru muncul, classifier model dapat melakukan klasifikasi, yang mana dari ketiga obat tersebut yang cocok untuk pasien tersebut.

14

Classifier model

Modelling

Input

Kategorisasi

Page 15: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Beberapa Algoritma Klasifikasi

β€’ K-Nearest Neighbor

β€’ Decision Tree

β€’ Logistic Regression

β€’ Support Vector Machines

β€’ Neural Networks

15

Page 16: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

DistanceDistance

Page 17: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Distance

β€’ Distance digunakan untuk mengukur similarity antara dua buahobject

β€’ Salah satu metode yang digunakan adalah Minkowski distance:

dimana i = (xi1, xi2, …, xip) dan j = (xj1, xj2, …, xjp) adalah dua buah p-dimensional data objects, dan q bernilai integer positif

qq

pp

qq

jx

ix

jx

ix

jx

ixjid )||...|||(|),(

2211

Page 18: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Distance

Minkowski distance

β€’ Jika q = 1 disebut Manhattan Distance

β€’ Jika q = 2 disebut Euclidean Distance

)||...|||(|),( 22

22

2

11 pp jx

ix

jx

ix

jx

ixjid

||...||||),(2211 pp j

xi

xj

xi

xj

xi

xjid

qq

pp

qq

jx

ix

jx

ix

jx

ixjid )||...|||(|),(

2211

Page 19: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Pengukuran Distance

Untuk mengukur distance antar object data, maupun object data dengan centroid cluster, dapat menggunakan

β€’ Euclidean Distance

β€’ Manhattan Distance

β€’ Correlation Distance

Page 20: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Pengukuran DistanceDiketahui vectors x = (x1, …, xn), y = (y1, …, yn)

β€’ Euclidean Distance:

β€’ Manhattan Distance:

β€’ Correlation Distance:

n

i

iiE yxyxd1

2)(),(

.),(1

n

i

iiM yxyxd

.)()(

))((

1),(

1

2

1

2

1

i

i

i

i

i

ii

C

yyxx

yyxx

yxd

Page 21: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Tipe Data

β€’ Interval-scaled variables

β€’ Binary variables

β€’ Nominal, ordinal, and ratio variables

β€’ Variables of mixed types.

Page 22: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Distance untuk Interval-valued variables

β€’ Euclidean Distance

β€’ Manhattan Distance

β€’ Correlation Distance

Page 23: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Distance untuk Interval-valued variables

Contoh

A(3,2)

B(10,6)

𝑑𝐸 𝐡, 𝐴 = (10 βˆ’ 3)2+(6 βˆ’ 2)2

𝑑𝐸 𝐡, 𝐴 = 8.06

𝑑𝐸 𝐡, 𝐴 = 49 + 16

𝑑𝐸 𝐡, 𝐴 = 65

𝑑𝑀 𝐡, 𝐴 = | 10 βˆ’ 3 | + |(6 βˆ’ 2)|

𝑑𝑀 𝐡, 𝐴 = 11

Euclidean Distance

Manhattan Distance

Page 24: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Distance untuk Binary Variables

β€’ A contingency table untuk binary data

β€’ Simple Matching Coefficient

(invariant, jika binary variablenya symmetric):

β€’ Jaccard Coefficient

(noninvariant, jika binary variable nya asymmetric):

dcbacb jid

),(

cbacb jid

),(

pdbcasum

dcdc

baba

sum

0

1

01

Object i

Object j

Page 25: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

25

Distance untuk Binary Variables

Contoh

β€’ Gender : symmetric attribute

β€’ Semua atribut selain gender : asymmetric attribute

β€’ Bila nilai Y and P direpresentasikan dengan 1, dan N menjadi 0, maka

Name Gender Fever Cough Test-1 Test-2 Test-3 Test-4

Jack M Y N P N N N

Mary F Y N P N P N

Jim M Y P N N N N

75.0211

21),(

67.0111

11),(

33.0102

10),(

maryjimd

jimjackd

maryjackd

cbacb jid

),(

Page 26: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

26

Distance untuk Nominal Variables

β€’ Nominal variable dibentuk dengan pengembangan binary variable

yang mempunyai lebih dari 2 state, misalnya warna (red, yellow, blue,

green), suhu (panas, sedang, dingin)

β€’ Distance dapat diukur dengan metode : Simple Matching

m: jumlah variable yang sama,

p: total jumlah variables

pmp

jid

),(

Page 27: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

27

Distance untuk Nominal Variables

Contoh :

m: jumlah variable yang sama,

p: total jumlah variables

𝑑 𝐴, 𝐡 =5 βˆ’ 3

5=2

5= 0.4

pmp

jid

),(

Object Var 1 Var 2 Var 3 Var 4 Var 5

A Merah Tinggi Panas Luar Berat

B Merah Pendek Panas Dalam Berat

C Kuning Sedang Dingin Luar Ringan

Page 28: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

k-Nearest Neighbor (k-NN)k-NN

Page 29: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Apa itu K-Nearest Neighbor

β€’ Sebuah metode untuk melakukanklasifikasi berdasarkan similaritasterhadap data lainnya.

β€’ Beberapa data terdekat disebutdengan β€œTetangga” atau β€œNeighbors”

β€’ Tetangga yang terdekat dianggap memiliki kemiripan dengan data yang dimaksud.

29

Page 30: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Contoh Penerapan k-NN

30

β€’ Bayangkan sebuah perusahaan provider telekomunikasi.

β€’ Perusahaan tersebut mengumpulkan data pelanggannya lengkapdengan penggunaan layanan yang dipilihnya.

Page 31: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Contoh Penerapan k-NN

31

β€’ Berdasarkan data tersebut, perusahaan seharusnya dapat menemukan polapelanggan seperti apa yang senang memilih basic, e-service, plus, dan total.

β€’ Sebagai contoh: akan memilih layanan mana pelanggan baru ini?

Page 32: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

k-NN (k = 1)

32

β€’ Untuk penyederhanaan, hanya dua variable yang digunakan untuk melakukan klasifikasi yaituIncome dan Age

β€’ Plot sebaran data pelanggan.

Page 33: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

k-NN (k = 1)

33

β€’ Sekarang, andai pelanggan baru memiliki:

β€’ Age = 50

β€’ Income = 166

β€’ Termasuk kategori manakah pelanggan baruini?

Page 34: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

k-NN (k = 1)

34

β€’ Hitung distance dari pelanggan baru ke semua pelangganyang lain

β€’ Tentukan 1 pelanggan yang terdekat (k = 1) denganpelanggan yang baru yaitu yang memiliki nilai distanceterkecil.

β€’ Pelanggan baru tersebut diklasifikasikan sama denganpelanggan terdekat

β€’ Klasifikasi pelanggan baru adalah Total Service

Page 35: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

k-NN (k = 3)

35

β€’ Hitung distance dari pelanggan baru ke semuapelanggan yang lain

β€’ Tentukan 3 pelanggan yang terdekat (k = 3) denganpelanggan yang baru.

β€’ Klasifikasi pelanggan baru: 1 Plus Service, 2 Total Service (pelanggan baru = Total Service)

Page 36: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

k-NN (k = 5)

36

β€’ Hitung distance dari pelanggan baru ke semuapelanggan yang lain

β€’ Tentukan 5 pelanggan yang terdekat (k = 5) denganpelanggan yang baru.

β€’ Klasifikasi pelanggan baru: 3 Plus Service, 2 Total Service (pelanggan baru = Plus Service)

Page 37: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Algoritma k-Nearest Neighbor

1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan data training 𝑷 yang telah dilengkapi label classnya .

2. Pilih nilai dari jumlah ketetanggan π‘˜.

3. Hitung jarak antara 𝑝 ke seluruh data yang ada dalam 𝑷.

4. Ambil π‘˜ observasi yang merupakan data terdekat dengan 𝑝.

5. Klasifikasikan data tersebut dengan mayoritas class dari π‘˜-tetangga terdekatnya.

37

Page 38: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Menentukan Jumlah 𝐾

β€’ Bagaimana menentukan jumlah 𝐾 yang tepat?

38

Page 39: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Training dan Testing Data (Split Test)

β€’ Data dibagi menjadi 2 :

β€’ Training data = Membuat model classifier.β€’ Testing data = Memeriksa akurasi dari classifier

39

Training Data

Testing Data

Page 40: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Training dan Testing Data

40

Classifier model

Modelling

Input

Class

2

class = 3

TidakAkurat!!

Training Data

Testing Data

Page 41: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Menentukan Jumlah 𝐾

β€’ Gunakan testing data untuk memeriksa berapakah jumlah 𝐾 yang tepat!

β€’ Dari beberapa kali uji coba, temukan jumlah 𝐾 yang memiliki tingkatakurasi tertinggi.

41

Page 42: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Evaluasi KlasifikasiEvaluasi Klasifikasi

Page 43: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

Confusion Matrix

β€’ True Positive (TP):β€’ Predicted: Positiveβ€’ Actual: Positive

β€’ False Negative (FN):β€’ Predicted: Negativeβ€’ Actual: Positive

β€’ False Positive (FP):β€’ Predicted: Positiveβ€’ Actual: Negative

β€’ True Negative (TN):β€’ Predicted: Negativeβ€’ Actual: Negative

43

Page 44: Algoritma Klasifikasi - unhas.ac.idUnhas.ac.id/amil/S1TIF/DM2020/06 Algoritma Klasifikasi.pdfAlgoritma k-Nearest Neighbor 1. Diberikan sebuah data tidak terklasifikasi 𝑝, dan kumpulan

F1 Scoreβ€’ π΄π‘˜π‘’π‘Ÿπ‘Žπ‘ π‘– =

𝑇𝑃+𝑇𝑁

(𝑇𝑃+𝑇𝑁+𝐹𝑃+𝐹𝑁)

β€’ Precision (Positive Predictive Value) =𝑇𝑃

(𝑇𝑃+𝐹𝑃)

β€’ Recall(True Positive Rate) =𝑇𝑃

(𝑇𝑃+𝐹𝑁)

44

F1-Score = 2 Γ—(Precision Γ—Recall)(Precision +Recall)