OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

84
การจาแนกภาพขวดแบบเซ็ตเปิดด้วยโครงข่ายประสาทเทียมแบบคอนโวลูชัน OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION NEURAL NETWORK ศุภณัฐ จินตวัฒน์สกุล บัณฑิตวิทยาลัย มหาวิทยาลัยศรีนครินทรวิโรฒ 2562

Transcript of OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

Page 1: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

การจ าแนกภาพขวดแบบเซตเปดดวยโครงขายประสาทเทยมแบบคอนโวลชน OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION NEURAL NETWORK

ศภณฐ จนตวฒนสกล

บณฑตวทยาลย มหาวทยาลยศรนครนทรวโรฒ 2562

Page 2: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

การจ าแนกภาพขวดแบบเซตเปดดวยโครงขายประสาทเทยมแบบคอนโวลชน

ศภณฐ จนตวฒนสกล

ปรญญานพนธนเปนสวนหนงของการศกษาตามหลกสตร วทยาศาสตรมหาบณฑต สาขาวชาเทคโนโลยสารสนเทศ

คณะวทยาศาสตร มหาวทยาลยศรนครนทรวโรฒ ปการศกษา 2562

ลขสทธของมหาวทยาลยศรนครนทรวโรฒ

Page 3: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION NEURAL NETWORK

SUPANAT JINTAWATSAKOON

A Thesis Submitted in partial Fulfillment of Requirements for MASTER OF SCIENCE (Information Technology)

Faculty of Science Srinakharinwirot University 2019

Copyright of Srinakharinwirot University

Page 4: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

ปรญญานพนธ เรอง

การจ าแนกภาพขวดแบบเซตเปดดวยโครงขายประสาทเทยมแบบคอนโวลชน ของ

ศภณฐ จนตวฒนสกล

ไดรบอนมตจากบณฑตวทยาลยใหนบเปนสวนหนงของการศกษาตามหลกสตร ปรญญาวทยาศาสตรมหาบณฑต สาขาวชาเทคโนโลยสารสนเทศ

ของมหาวทยาลยศรนครนทรวโรฒ

(รองศาสตราจารย นายแพทยฉตรชย เอกปญญาสกล)

คณบดบณฑตวทยาลย

คณะกรรมการสอบปากเปลาปรญญานพนธ

.............................................. ทปรกษาหลก (อาจารย ดร.วรยทธ เจรญเรองกจ)

.............................................. ประธาน (ดร.สทธพงศ ธชยพงษ)

.............................................. กรรมการ (ผชวยศาสตราจารย ดร.นวย ววฒนวฒนา)

Page 5: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

บทคดยอภาษาไทย

ชอเรอง การจ าแนกภาพขวดแบบเซตเปดดวยโครงขายประสาทเทยมแบบคอนโวลชน

ผวจย ศภณฐ จนตวฒนสกล ปรญญา วทยาศาสตรมหาบณฑต ปการศกษา 2562 อาจารยทปรกษา อาจารย ดร. วรยทธ เจรญเรองกจ

การจ าแนกภาพ (Image Classification) ดวยโครงขายประสาทเทยมแบบคอนโวล

ชน ไดรบความนยมอยางมากในชวงไมกปทผานมา เนองจากมความแมนย าสงส าหรบปญหาการจ าแนกแบบเซตปด(close-set) วทยานพนธนเปนศกษาประสทธภาพในแงความแมนย าเมอใชโครงขายประสาทเทยมแบบคอนโวลชนกบปญหาการจ าแนกแบบเซตเปด (open-set) ซงเปนสภาพแวดลอมทคลาสเปาหมาย(taget class) ไมปรากฏในขนตอนการฝกฝน โดยสนใจแกปญหาการจ าแนกภาพขวดเครองดมออกเปน 3 คลาสหลกและจ าแนกเปนคลาสทไมรจก ผานหลายการทดลองไดแก N-Binary, N+unknown, N+combination, 2 Layer Classification(OC-SVM and Multi-class model) and 2 Layer Classification(Isolation Forest and Multi-class model) ผลการทดลองแสดงให เหนวา N+unknown มความแมนย าสง 92% เหนอกวาว ธการอนๆ วทยานพนธกลาวถงผลลพธในแงของความถกตองและเวลาการฝกฝนแบบจ าลองส าหรบการวจยในอนาคตและการประยกตใชการจ าแนกภาพ

ค าส าคญ : โครงขายประสาทเทยม, โครงขายประสาทเทยมแบบคอนโวลชน, การจ าแนกภาพ, เซตเปด

Page 6: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

บทคดยอภาษาองกฤษ

Title OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION NEURAL NETWORK

Author SUPANAT JINTAWATSAKOON Degree MASTER OF SCIENCE Academic Year 2019 Thesis Advisor Dr. Werayuth Charoenruengkit

The image classification technique based on the convolution neural network

(CNN) has been gaining popularity in recent years due to its high accuracy for close-set classification problems. This thesis explores the accuracy performance of CNN on an open-set problem with a target class that is not specified in the training model. By focusing on the three classes of beverage bottle images, the models must be able to classify the input beverage image as one of the three classes and able to identify unknown or unseen types. The proposed methods to investigate several approaches based on the N-Binary, N+unknown, N+combination, two-layer Classification (OC-SVM and multi-class model) and two-layer classification (Isolation Forest and Multi-Class Model). The results showed that N+unknown approach achieved 92% overall accuracy and outperformed other models. This thesis discusses the results in terms of accuracy and training time for future research and image classification applications.

Keyword : Convolution neural network, open-set, Image classification, Neural network

Page 7: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

กตตกรรมประ กาศ

กตตกรรมประกาศ

ปรญญานพนธนส าเรจลลวงไดดวยด ดวยความอนเคราะหจาก อ. ดร. วรยทธ เจรญเรองกจ อาจารยทปรกษาวทยานพนธ ผใหค าแนะน าและขอเสนอแนะตางๆ

ขอกราบขอบพระคณคณะกรรมการสอบปรญญานพนธส าหรบขอเสนอแนะอนเปนประโยชนตอการปรบปรงปรญญานพนธ

ขอกราบขอบพระคณบณฑตวทยาลย มหาวทยาลยศรนครนทรวโรฒ ส าหรบทนสนบสนนการวจยและน าเสนอผลงาน

ศภณฐ จนตวฒนสกล

Page 8: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

สารบญ

หนา บทคดยอภาษาไทย ................................................................................................................ ง

บทคดยอภาษาองกฤษ ........................................................................................................... จ

กตตกรรมประกาศ .................................................................................................................. ฉ

สารบญ ................................................................................................................................. ช

สารบญตาราง ....................................................................................................................... ญ

สารบญรปภาพ ...................................................................................................................... ฎ

บทท 1 บทน า ......................................................................................................................... 1

1.1 ภมหลง ....................................................................................................................... 1

1.2 ความมงหมายของงานวจย ........................................................................................... 2

1.3 ความส าคญของการวจย .............................................................................................. 2

1.4 ขอบเขตของการวจย .................................................................................................... 3

1.5 กรอบแนวคดงานวจย ................................................................................................... 3

บทท 2 เอกสารและงานวจยทเกยวของ ................................................................................... 3

2.1 Open-set classification ............................................................................................. 3

2.2 ทฤษฎทเกยวของกบโครงขายประสาทเทยม .................................................................. 5

2.2.1 ฟงกชนกระตน (Activation Function) ................................................................. 6

2.2.2 การฝกฝนแบบจ าลองโครงขายประสาทเทยม ....................................................... 7

2.2.3 ฟงกชนสญเสย (Loss Function) ......................................................................... 7

ครอส-เอนโทรป ลอซ (Cross-entropy loss) ........................................................ 7

2.2.4 การหาคาทดทสด (Optimization) ....................................................................... 8

Full-Batch Gradient Descent ........................................................................... 8

Page 9: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

Stochastic Gradient Descent .......................................................................... 8

Mini-Batch Gradient Descent .......................................................................... 9

2.3 ทฤษฎทเกยวของกบโครงขายประสาทเทยมแบบคอนโวลชน (Convolution Neural Network) .................................................................................................................... 9

2.3.1 ชนคอนโวลชน (Convolution Layer) ................................................................. 10

2.3.2 ชนพลลง (Pooling Layer) ................................................................................ 12

2.3.3 ชนเชอมโยงสมบรณ Fully Connected Layer ................................................... 14

2.3.4 ฟงกชนซอฟตแมกซ (Softmax function) ........................................................... 15

2.4 Residual Networks (ResNet) ................................................................................... 15

2.4.1 Residual Blocks ............................................................................................. 15

2.4.2 ResNet Model ................................................................................................ 16

2.4 One-Class Support Vector Machine ....................................................................... 18

2.5 Isolation Forest ........................................................................................................ 18

2.6 การวเคราะหองคประกอบหลก (Principal Component Analysis) ............................... 19

2.7 งานวจยทเกยวของ .................................................................................................... 20

2.7.1 งานวจยกลม CNN-Based Image Classification ............................................. 20

2.7.2 งานวจยกลม Open-set classification.............................................................. 23

2.7.3 งานวจยกลม Anomaly Detection .................................................................... 24

บทท 3 วธด าเนนงานวจย .................................................................................................... 26

3.1 การเตรยมขอมลส าหรบการวจย ................................................................................. 26

3.1.1 ตรวจจบวตถทสนใจ (Object Detection) .......................................................... 27

3.1.2 จดประเภทของภาพ (Labeling) ........................................................................ 28

3.2 การสรางแบบจ าลองการจ าแนกภาพ .......................................................................... 32

Page 10: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

3.2.1 N-Binary Classifier ......................................................................................... 32

3.2.2 N+1 Class Classifier ...................................................................................... 34

3.2.3 2 Layer Classification (Two Layer Classification) ......................................... 34

1. Pre-trained model ............................................................................. 36

2. Feature Extraction ............................................................................. 36

3. Anomaly Detection Model ................................................................. 37

3.2.3 การวดประสทธภาพและวเคราะหผล ................................................................. 38

บทท 4 การด าเนนการวจยและผลการวจย ............................................................................ 39

4.1 Based Model (Multi-Class Model) .......................................................................... 39

4.2 Exploring SoftMax Probability Score ...................................................................... 43

4.3 N-Binary Classifier .................................................................................................. 46

4.4 N+Unknown Class Classifier .................................................................................. 50

4.5 N+Combination Class Classifier ............................................................................. 52

4.6 2-Layer Classification (OC-SVM and Multi-Class Model) ....................................... 54

4.7 2-Layer Classification (Isolation Forest and Multi-Class Model) ............................ 56

4.8 Dimension Reduction .............................................................................................. 58

บทท 5 สรปผลการวจย อภปรายผล และขอเสนอแนะ ........................................................... 63

5.1 สรปผลการวจย .......................................................................................................... 63

5.2 อภปรายผลการวจย ................................................................................................... 64

5.3 ขอเสนอแนะและแนวทางการวจยในอนาคต ................................................................ 65

บรรณานกรม ....................................................................................................................... 66

ประวตผ เขยน ....................................................................................................................... 69

Page 11: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

สารบญตาราง

หนา ตาราง 1 แสดงจ านวนภาพทสกดไดแยกตามยหอเครองดม ..................................................... 28

ตาราง 2 เปรยบเทยบรปแบบการฝกฝนแบบจ าลอง ................................................................ 37

ตาราง 3 แสดงสถตของคะแนนความเชอมน ของภาพ unknown class จ านวน 1,592 ภาพ ..... 45

ตาราง 4 N-Binary Classifier Training Procedure ............................................................... 47

ตาราง 5 สรปประสทธภาพ ................................................................................................... 63

ตาราง 6 ประสทธภาพในการจ าแนก unknown class ........................................................... 64

Page 12: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

สารบญรปภาพ

หนา ภาพประกอบ 1 decission boundaries ของ close-set classification ..................................... 4

ภาพประกอบ 2 open-set classification ................................................................................. 4

ภาพประกอบ 3 เพอรเซปตรอน ............................................................................................... 5

ภาพประกอบ 4 แสดงโครงสราง Convolution Neural Network .............................................. 10

ภาพประกอบ 5 Convolution Layer ...................................................................................... 11

ภาพประกอบ 6 ผลลพธทไดจากฟงกชนเรคตไฟดเชงเสน (ReLU) ........................................... 12

ภาพประกอบ 7 Pooling Operation ..................................................................................... 13

ภาพประกอบ 8 การท าพลลง ................................................................................................ 14

ภาพประกอบ 9 โครงสรางอยางงายของ CNN ....................................................................... 14

ภาพประกอบ 10 Residual block ......................................................................................... 16

ภาพประกอบ 11 โครงสรางของ ResNet ............................................................................... 17

ภาพประกอบ 12 Decision boundary .................................................................................. 18

ภาพประกอบ 13 Isolation Forest Partitioning ..................................................................... 19

ภาพประกอบ 14 ขนตอนการลดมตขอมลดวย PCA .............................................................. 19

ภาพประกอบ 15 Data Augmentation .................................................................................. 22

ภาพประกอบ 16 ภาพถายตแชตนฉบบ ................................................................................. 26

ภาพประกอบ 17 แสดงขนตอนสรางชดขอมล .......................................................................... 27

ภาพประกอบ 18 Object Detection ..................................................................................... 27

ภาพประกอบ 19 เครองดมคลาส p1, p2 และ p3 ซงเปนคลาสหลก (Known class) ทตองทำการ

จำแนก ................................................................................................................................. 30

Page 13: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

ภาพประกอบ 20 ภาพเครองดมในประเภทอนๆ (Other Class) โดยมาจากการน าภาพเครองดม 41 ยหอ ทอยนอกเหลอจาก (Knonw class) มารวมกน .......................................................... 30

ภาพประกอบ 21 ตวอยางภาพขวดเครองดมในกลม Unknown Class ................................... 31

ภาพประกอบ 22 กราฟแสดงจ านวนภาพขวดแยกเปนคลาสตางๆ ........................................... 31

ภาพประกอบ 23 N-Binary classifier prediction procedure ................................................ 33

ภาพประกอบ 24 Procedure ................................................................................................ 35

ภาพประกอบ 25 ขนตอนการฝกฝนของ Multi-class classifier + OC-SVM และ Multi-class classifier + Isolation Forest ................................................................................................ 36

ภาพประกอบ 26 การใช Pre-trained model เพอสกดฟเจอร โดยการตดโครงสรางส ารบการท า classification ออกไป .......................................................................................................... 37

ภาพประกอบ 27 train loss, validation loss / epoch และ train accuracy, validation accuracy/epoch................................................................................................................. 40

ภาพประกอบ 28 Confusion Matrix ของ Based Multi-class model ...................................... 40

ภาพประกอบ 29 Heatmap แสดงจดส าคญของภาพทแบบจ าลองสกดได ของภาพทท านายถกตอง ................................................................................................................................ 41

ภาพประกอบ 30 Heatmap แสดงจดส าคญของภาพทแบบจ าลองสกดได ของภาพทท านายผด 42

ภาพประกอบ 31 การก าหนดคา threshold เพอระบ unknown class ในอดมคต ..................... 43

ภาพประกอบ 32 ตวอยางภาพขวดและการกระจายของคะแนนความนาจะเปนของภาพ unknown class ................................................................................................................... 44

ภาพประกอบ 33 การกระจายของคะแนนของภาพกลม unknown .......................................... 44

ภาพประกอบ 34 แสดงความแมนย าในการจ าแนก unknow และ known class ทระดบ threshold ตงแต 0.1 – 1.0 ................................................................................................... 46

ภาพประกอบ 35 train loss, validation loss / epoch และ train accuracy, validation accuracy/epoch ของ N-Binary Classifier แตละแบบจ าลอง .............................................. 48

ภาพประกอบ 36 Classification Report ของ N-Binary Classifier ........................................ 49

Page 14: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

ภาพประกอบ 37 train loss, validation loss / epoch และ train accuracy, validation accuracy/epoch ของ N+Unknown Classifier ................................................................... 50

ภาพประกอบ 38 Classification Report ของ N+Unknown Class Classifier ......................... 51

ภาพประกอบ 39 train loss, validation loss / epoch และ train accuracy, validation accuracy/epoch ของ N+Combination class classifier ..................................................... 53

ภาพประกอบ 40 Classification Report ของ N+Combination class classifier ..................... 53

ภาพประกอบ 41 2-Layer Classification (OC-SVM and Multi-Class Model) prediction procedure .......................................................................................................................... 54

ภาพประกอบ 42 ตวอยางฟเจอรทสกดไดจาก Pre-trained ResNet50 .................................... 55

ภาพประกอบ 43 Classification Report ของ OC-SVM and Multi-class................................ 56

ภาพประกอบ 44 2-Layer Classification (Isolation Forest + Based Model) ........................ 57

ภาพประกอบ 45 Classification Report ของ Isolation forest and Multi-class ...................... 58

ภาพประกอบ 46 แสดง variance/components .................................................................... 59

ภาพประกอบ 47 กราฟแสดง variance/จ านวน component ................................................. 59

ภาพประกอบ 48 Classification Report หลงท า PCA ของ OC-SVM and Multi-class............ 60

ภาพประกอบ 49 Classification Report หลงท า PCA ของ Isolation Forest and Multi-class . 60

Page 15: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

บทท 1 บทน า

1.1 ภมหลง Image Classification หรอการจ าแนกขอมลภาพออกเปนคลาสตาง ๆ เปนงานทไดรบการพฒนามาอยางตอเนองและมความส าคญอยางมาก เหนไดจากการน าไปประยกตใชในงานหลายๆแขนง ในปจจบนการจ าแนกภาพ(Image Classification) โดยการใชโครงขายแบบคอนโวลชน Convolution neural network (CNN) นนเปนวธทไดรบความนยมอยางมาก ดวยปจจยทการเรยนรเชงลก(Deep learning) สามารถท าไดงายขนเนองดวยจ านวนขอมลภาพทมเพมขนอยางมหาศาลและการมการประมวลผลแบบกลมเมฆ (Cloud computing service) ทท าใหสามารถเขาถง Computation unit ไดงายขนในราคาทถกลง และปจจยท CNN สามารถลดขนตอนทมความยงยากในการจ าแนกภาพโดยใชการเรยนรของเครอง (Machine learning based image classification) แบบดงเดมทตองสกดฟเจอร(feature extraction) เพอหาเสน (edge) ส (color) รปทรง (shape) ฯลฯ ดวยตวเอง (hand-crafted features) เพอใหไดฟเจอร(feature) ทเหมาะสมกบปญหาและชดขอมลนน ๆ กอนแลวน าไปสรางโมเดล ซงตางจาก CNN ทจะใชการเรยนรตงแตตนจนจบกระบวนการ (end-to-end learning) ตงแตการหาฟเจอร (feature) จนถงการสรางแบบจ าลอง และปจจยทส าคญทสดคอเรองประสทธภาพทใหความแมนย าสงกวามากเมอเทยบการจ าแนกภาพโดยใชการเรยนรของเครองแบบดงเดม อยางไรกตามการจ าแนกภาพโดยใชโครงขายประสาทเทยมแบบคอนโวลชน จะมประสทธภาพดและมความนาเชอถอภายใตสภาพแวดลอมแบบ Close-set เทานน เนองจาก แบบจ าลองจะถกฝกขนมาจากคลาสทเราทราบทงหมดและในขนตอนการท านายนนภาพทใชในการท านาย จะตองเปนภาพทอยในคลาสทปรากฏอยในขนตอนการเทรนโมเดลเทานน อยางไรกตามในการน าแบบจ าลองไปใชจรง มกจะอยภายใตสภาพแวดลอมแบบ Open-Set ซงเปนสภาพแวดลอมทมความเปนไปไดเสมอทภาพทใชในการท านายจะเปนภาพทไมไดอยในคลาสใด ๆ เลยในขนตอนการฝกฝนแบบจ าลอง ส าหรบปญหาในงานวจยนมาจากระบบ Bottle Beverage Image Classification ซงเปนการจ าแนกภาพขวดเครองดมออกเปนชนดตาง ๆ โดยภาพเหลานเปนภาพทถกถายดวยกลองจากโทรศพทจากตแชของตวแทนจ าหนายทวประเทศ ในการฝกแบบจ าลองนนเปนไปไดยากมากทสามารถสรางแบบจ าลองใหรจกภาพของขวดเครองดมทงหมดในทองตลาด และมโอกาสเสมอท

Page 16: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

2

จะพบเครองดมทไมเคยปรากฏมากอน กลาวคอหากใชแบบจ าลองกบภาพเหลานซงเปนภาพทไมปรากฏอยในคลาสใด ๆ ในขนตอนการฝกแบบจ าลอง ผลการท านายทไดกจะยงเปนคลาสหนงทอยในขนตอนฝกแบบจ าลองเสมอ ซงเปนค าตอบทไมถกตอง โดยวทยานพนธนไดน าเสนอวธการแกปญหาการจ าแนกภาพแบบ Open-set ของภาพขวดเครองดม ซงภาพท ใชท านายจะเปนภาพทอยในคลาสทปรากฏในขนตอนการฝกฝนแบบจ าลอง หรออาจไมไดอยในคลาสใดเลยในขนตอนการฝกฝนแบบจ าลองเลยกได

1.2 ความมงหมายของงานวจย ในการวจยครงนผวจยไดตงความมงหมายไวดงน

1. สรางแบบจ าลองบนพนฐานโครงขายประสาทเทยมแบบคอนโวลชน ส าหรบการจ าแนกภาพขวดเครองดมแบบเซตเปดทมความแมนย าสง

2. สามารถจ าแนกภาพขวดเครองดมออกเปนประเภททก าหนด (Target class) และสามารถระบวาเปนประเภททไมรจก (Unknown) เมอภาพทใชท านายไมไดอยในกลมของคลาสใดในขนตอนการฝกฝนแบบจ าลอง

3. เพอหาวธทเหมาะสมในการจ าแนกภาพทไมรจก (Unknown class) ซงเปนภาพทไมอยในคลาสใดในขนตอนการฝกฝนแบบจ าลอง

4. เพอทราบถงหลกการท างานของโครงขายประสาทเทยมแบบคอนโวลชน และน าไปปรบใชไดอยางเหมาะสม

1.3 ความส าคญของการวจย งานวจยนเปนการศกษาและน าเสนอวธแกปญหาของการจ าแนกภาพขวดเครองดมภายใตสภาพแวดลอมแบบ Open-set โดยภาพเครองดมเหลานจะถกจ าแนกออกเปนสนคาประเภทตาง ๆ ผลการท านายจะถกแปรผลและน าไปใชในการวเคราะหสวนแบงทางการตลาดในแตละพนท แบบจ าลองทใชในการท านายจะถกฝกฝนขนมาโดยอาศยภาพสนคาทถกรวบรวมและท าการแยกเปนคลาสตาง ๆ ไว แตเมอโมเดลถกน าไปใชงานจรงพบวามโอกาสเสมอทขอมลภาพทสงมาท านายจะเปนภาพทไมไดอยในกลมของคลาสใด ๆเลยทปรากฏในขนตอนการฝกฝนแบบจ าลองซงจะสงผลใหเกดความผดพลาดในการท านาย สงผลใหการแปรผลผดพลาดไปดวยซงจะเปนปญหา ในภาคธรกจทตองน าผลทไดไปใชตอ ทงในการวางแผนการตลาด แผนการกระจายสนคา ฯลฯ

Page 17: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

3

1.4 ขอบเขตของการวจย ผวจยไดก าหนดขอบเขตของานวจยไวดงตอไปน

1. พฒนาแบบจ าลองส าหรบการจ าแนกภาพโดยใชโครงขายประสาทเทยมแบบคอนโวลชน ส าหรบการจ าแนกภาพขวดเครองดมแบบเซตเปด โดยแบบจ าลองทไดจะมาจากการทดลอง N-Binary Classifier, N+unknown Class classifier, N+combination Class Classsifier, 2 Layer Classification(OC-SVM and Multi-class model) and 2 Layer Classification(Isolation Forest and Multi-class model)

2. เปรยเทยบประสทธภาพแบบจ าลองในแงของความแมนย าและเวลาทใชในการฝกฝนแบบจ าลอง โดยใชชดขอมลภาพเครองดม ซงประกอบดวย - ชดขอมลภาพถายสนคาเครองดม 44 คลาส (44 ประเภทสนคา) จ านวน 11,309

ภาพ ซงเปนภาพ - ชดขอมลภาพสนคาเครองดม 1,592 ภาพ ซงเปนขอมลทเปนสนคาทม SKU ไม

ซ ากบ SKU ในชดขอมลแรกเลย

1.5 กรอบแนวคดงานวจย งานวจยนเปนการศกษาและน าเสนอวธแกปญหาของการจ าแนกภาพขวดเครองดม โดยใชเทคนคโครงขายประสาทเทยมแบบคอนโวลชน เพอสรางแบบจ าลองในการจ าแนกภาพขวดเครองดมภายใตสภาพแวดลอมแบบ Open-set ทภาพในการท านายอาจจะเปนภาพทอยนอกกลมของภาพทใชในการฝกฝนแบบจ าลอง

Page 18: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

บทท 2 เอกสารและงานวจยทเกยวของ

ในการวจยครงนผ วจยไดศกษาเอกสารและงานวจยทเกยวของ และไดจ าแนกออกตามหวขอดงตอไปน

1. ทฤษฎทเกยวของกบ Open-set classification 2. ทฤษฎทเกยวของกบ Convolution Neural Network 3. ทฤษฎทเกยวของกบ Residual Networks (ResNet) 4. ทฤษฎทเกยวของกบ Generative Adversarial Networks (GANs) 5. ทฤษฎทเกยวของกบ Variational Autoencoders (VAEs) 6. ทฤษฎทเกยวของกบ One-Class Support Vector Machine 7. ทฤษฎทเกยวของกบ Isolation Forest 8. ทฤษฎทเกยวของกบ Principal Component Analysis

2.1 Open-set classification โดยปกตแลวในการสรางแบบจ าลองเพอการจ าแนก (Classification Model) แบบจ าลองจะถกฝกฝนมาจากขอมลทถกแยกไวเปนคลาสตาง ๆ (class label) จากนนเมอโมเดลถกน าไปใชงานจรง ขอมลทใชในการท านายจะตองเปนขอมลทเปนคลาสใดคลาสหนงทอยในขนตอนการปฝกฝนแบบจ าลองเท าน น ซ ง ถอเปนสภาพแวดลอมแบบ close-set ในทางตรงกน ขามสภาพแวดลอมแบบ open-set เมอน าแบบจ าลองไปใชงานจรงแลว ภาพทใชท านายสามารถเปนภาพทอยนอกเหนอกลมของภาพทใชในขนตอนฝกฝนแบบจ าลองไดนน (Scheirer, Rocha, Sapkota, & Boult, 2013) (Bendale & Boult, 2015)ภาพประกอบท 1 แสดงใหเหน Decision Boundaries ของคลาส สนข, แมว และ มา ในการจ าแนกภาพแบบ close-set หากน าแบบจ าลองนไปใชจรงแลวสมมตภาพทใชท านายเปนภาพของเสอ ผลการท านายทไดกจะยงเปน สนข, แมว และ มา เทานน

Page 19: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

4

ภาพประกอบ 1 decission boundaries ของ close-set classification

จากภาพประกอบท 2 ซงแสดงใหเหนถง Open-set classification จากภาพจะเหนวานอกเหนอจากคลาสหลก(known class) ซงประกอบดวย สนข, แมว และ มา แลว ยงมคลาสอน ๆ(unknown class) ทยงไมทราบอยดวย

ภาพประกอบ 2 open-set classification

กลาวโดยสรปแลวในปญหา Open-set classification น น ในขนตอนการทดสอบแบบจ าลอง (testing) จะมทงคลาสทรจก(known class) ซงเปนคลาสทใชในขนตอนการฝกฝน และคลาสทเราไมรจก(unknown class) ซงเปน class ทไมปรากฏอยในขนตอนการฝกฝนมากอนเลย ซ งจะแตกตางจาก ปญหา Close-set classification ท งแบบ binary และ multi-class classification ตรงทในขนตอนการฝกฝนและทดสอบจะใชแค known class เพยงเทานน

Page 20: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

5

2.2 ทฤษฎทเกยวของกบโครงขายประสาทเทยม โครงขายประสาทเทยมเปนแบบจ าลองทมการท างานเลยนแบบการท างานของสมอง อาศยการเรยนรโดยใชหนวยประมวลผลจ านวนมากรวมกนเปนโครงขายซงมลกษณะเหมอนเซลลสมองมนษย โดยมสวนขอมลรบเขาหรออนพต (Input) และสงคาถวงน าหนก (Weight) ผานการประมวลผลแลวจะไดขอมลออกหรอเอาตพต (Output)

ภาพประกอบ 3 เพอรเซปตรอน

ในโครงขายประสาทเทยมนนจะประกอบขนจากเพอรเซปตรอน(Perceptron) ซงเปนหนวยพนฐานทเลกทสด ภาพประกอบท 3 แสดงโครงสรางของเพอรเซปตรอน ซงสามารถเขยนในรปสมการไดดงสมการท 1

𝑦 = 𝑓 (𝑏 +∑𝑤𝑖𝑥𝑖

𝑛

𝑖=1

)

ขอมลรบเขา (Input) 𝑋 = [𝑥1, 𝑥2, … , 𝑥𝑛]

𝑥𝑖คอ ขอมลรบเขา (Input) แตละตว

พารามเตอร (Parameter) 𝑊 = [𝑤1, 𝑤2, … , 𝑤𝑛] , 𝑏

𝑤𝑖คอ คาถวงน าหนก (Weight) ดงนน 𝑥𝑖 · 𝑤𝑖 คอ Input ทถกถวงน าหนก 𝑏 คอ คาความเอนเอยง (Bias)

(1)

Page 21: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

6

เอาทพต (Output) 𝑧 = 𝑤1 · 𝑥1 + 𝑤2 · 𝑥2 +⋯+𝑤𝑛 · 𝑥𝑛 + 𝑏

𝑦 = 𝑓(𝑧)

𝑧 คอ ผลรวมของขอมลเขาทถวงน าหนกแลว ∑ 𝑤𝑖𝑥𝑖𝑛𝑖=1 + 𝑏

𝑓(. ) คอ ฟงกชนกระตน (Activation function) 𝑦 คอ ขอมลสงออก (output) จากเพอรเซปตรอน

2.2.1 ฟงกชนกระตน (Activation Function) ฟงกชนกระตน (Activation Function) เปนฟงกชนทเปนตวก าหนดวาเพอเซปตรอนจะสงขอมลออกในลกษณะใด ซงฟงกชนกระตนมหลายรปแบบ เชน ฟงกชนซกมอยด (Sigmoid function), ฟงกชนไฮเพอรโบลกแทนเจนต (Hyperbolic Tangent Function; Tanh), ฟงกชนเรคตไฟดเชงเสน (Rectified Linear Unit Function; ReLU)

𝜎(𝑧) = 1

1 + exp(−𝑧)

𝑡𝑎𝑛ℎ (𝑧) = exp(𝑧) − exp(−𝑧)

exp(𝑧) + exp(−𝑧)

ReLU(z) = max (0, z)

สมการท 2 คอฟงกชนซกมอยดจะใหผลลพธอยในชวง 0 ถง 1 สมการท 3 ฟงกชนไฮเพอรโบลกแทนเจนตจะใหผลลพธอยในชวง -1 ถง 1 และ สมการท 4 ฟงกชนเรคตไฟดเชงเสนจะใหผลลพธเปน 0 หรอ z

(2)

(3)

(4)

Page 22: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

7

2.2.2 การฝกฝนแบบจ าลองโครงขายประสาทเทยม เปามายของการงฝกฝนแบบจ าลองกเพอใหไดแบบจ าลองทมความแมนย าทสด ในการวดวาแบบจ าลองสามารถท านายผลไดดแคไหนตองมการนยามฟงกชนตนทน (loss function) ขนมาเมอจะหาความแตกตางระหวางคาจรง 𝑦 เปรยบเทยบกบคาทท านาย �� ในขนตอนการฝกโครงขายประสาทเทยม คาถวงน าหนก (𝑤𝑒𝑖𝑔ℎ𝑡) และคาความเอนเอยง (𝑏𝑖𝑎𝑠) จะถกปรบเปลยนเพอใหไดฟงกชนตนทนนอยลงทสด ดงทแสดงในสมการท 5

จากสมการ 𝑦 คอ คาจรง �� คอ คอคาทท านาย 𝐿(𝑦, ��) คอ ฟงกชนตนทน (loss function)

2.2.3 ฟงกชนสญเสย (Loss Function) ในการฝกฝนแบบจ าลองคาจาก loss function เปนตวแปรทใชในการปรบคาถวงน าหนก เพอหาคาถวงน าหนกทดทสดทท าใหคาของฟงกชนตนทนนอยทสด ฟงกชนตนทนมอยหลายฟงกชนโดยตองเลอกใชใหเหมาะสมปญหา เชน Cross-entropy, MSE, Kullback Leibler ฯลฯ

ครอส-เอนโทรป ลอซ (Cross-entropy loss)

ครอส-เอนโทรป ลอซ (Cross-entropy loss) เปนฟงกชนใชบงชประสทธภาพของแบบจ าลองวาสามารถจ าแนกไดผดพลาดแคไหน ในสมการท 6 แสดงการหา Cross-entropy loss ส าหรบการจ าแนกเปนหลายประเภท(Multi-class classification) เพอบอกประสทธภาพในการจ าแนกซงผลลพธคอคาความนาจะเปนระหวาง 0 ถง 1

(5)

(6)

Page 23: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

8

2.2.4 การหาคาทดทสด (Optimization) การหาคาทดทสด (Optimization) มเปาหมายเพอหาพารามเตอรหรอคาถวงน าหนกทดทสดเพอปรบปรงแบบจ าลองใหมประสทธภาพดขน โดยวธการทนยมใชกนกคอการเคลอนลงตามความชน (Gradient Descent Algorithm) จากสมการท 7 เกรเดยนต ∇𝑔( 𝑤 ) คอ เวคเตอรของอนพนธยอย(Partial derivatives) ทงหมด ซงจะบอกถงความเปลยนแปลงของ 𝑔( 𝑤 ) เมอ 𝑤 เปลยน

คาถวงน าหนกใหมจะหาไดจากสมการท 8 โดยท

𝛼 คอ อตราการเรยนร (learning rate) 𝜕𝐿

𝜕𝑊 คอ เกรเดยนตของฟงกชนตนทนเทยบกบคาถวงน าหนก

Full-Batch Gradient Descent

ฟลแบตซเกรเดยนตเดสเซนท (Full-Batch Gradient Descent) จะใช ขอมลทกจดในการค านวณเกรเดยนต ดงทแสดงในสมการท 9 แสดงใหเหนการ ค านวณเกรเดยนตจากคอขอมลตวท 1 ถง 𝑁

Stochastic Gradient Descent

สโตแคสตกเกรเดยนตเดสเซนท (Stochastic Gradient Descent; SGD) จะใชขอมลเพยงจดเดยวในการค านวณเกรเดยนตแทนทการใชทกจดแบบดงท แสดงในสมการท 10

(7)

(8)

(9)

(10)

Page 24: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

9

Mini-Batch Gradient Descent มนแบตซเกรเดยนตเดสเซนท (Mini-Batch Gradient Descent) จะใช

ขอมลบางสวนในการค านวณเกรเดยนต จากสมการท 11 แสดงใหเหนการค าวณ เกรเดยนตจากคอขอมลตวท 𝑘 ถง 𝑘 +𝑚

2.3 ทฤษฎทเกยวของกบโครงขายประสาทเทยมแบบคอนโวลชน (Convolution Neural Network) โครงขายประสาทเทยมแบบคอนโวลชน (Convolution Neural Network; CNN) เปนโครงขายประสาทเทยมเชงลก (Deep Neural Network) ทประกอบดวยเซตของฟลเตอร (Filter) ซงฟลเตอรเหลานในจะใชเพอท าคอนโวลชนกบอนพต และในระหวางขนตอนการฝกฝน(train neural network) ฟลเตอรเหลาน กจะถกปรบคาเพอใหได ฟลเตอรท เหมาะสมทสด โดยมจดประสงคคอการสกดฟเจอรจากภาพ (Feature Extraction) โครงขายประสาทเทยมแบบคอนโวลชนไดรบความนยมอยางมากหลงจาก Krizhevsky ไดน าเสนอ AlexNet (Krizhevsky, Sutskever, & Hinton, 2012) ซงสามารถเอาชนะในการแขงขน ImageNet Large Scale Visual Recognition Challenge (ILSVRC) โดยสามารถท าคะแนนไดสงกวาเทคนคแบบดงเดม และ CNN Based Architecture ยงถกพฒนาอยางตอเนองเหนไดจาก top 5 error rate ของชดขอมล ImageNet ลดจาก ~25% จนเหลอ ~2.25% ภายใน 5 ปหลงจาก AlexNet ถกน าเสนอ ซง error rate ท ~2.5 % นนถอวานอยกวา human error อกดวย ปจจบน CNN ถกประยกตไปใชในคอมพวเตอรวทศน (Computer vision) ไมวาจะเปนการท า Image Classification, Object Detection, Image and Video Recognition ฯลฯ

(11)

Page 25: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

10

ภาพประกอบ 4 แสดงโครงสราง Convolution Neural Network

ทมา: Convolutional Neural Network. (n.d.). Retrieved December 1, 2019, from https://www.mathworks.com/solutions/deep-learning/convolutional-neural-network.html

จากภาพประกอบท 1 ไดแสดงโครงสรางของโครงขายประสาทเทยมแบบคอนโวลชนโดยเรมตนท ชนขอมลเขา (Input Layer) จะรบขอมลเขาเปนรปภาพเพอเขาสการด าเนนการทชนตาง ๆ โดยสามารถจดประเภทของชนตางๆ ไดเปน ชนคอนโวลชน (Convolution Layer), ชนพลลง (Pooling Layer), ชนเชอมโยงโดยสมบรณ (Fully-Connected Layer)

2.3.1 ชนคอนโวลชน (Convolution Layer) ชนคอนโวลชน(Convolution Layer) มไวเพอท าการคอนโวลชนระหวางอนพต(Input) กบ

ฟลเตอร/เคอรเนล(Filter/Kernel) ผลลพธทไดคอฟเจอรแมพ/แอคทเวชนแมพ (Feature Map/ Activation Map) ดงทแสดงในภาพประกอบท 5 โดยทฟลเตอรจะมการสมและปรบเปลยนในขนตอนการเรยนร

Page 26: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

11

ภาพประกอบ 5 Convolution Layer

ทมา: Khan, S., Rahmani, H., Shah, S. A. A., Bennamoun, M., Medioni, G., & Dickinson, S. (2018). A Guide to Convolutional Neural Networks for Computer Vision. Retrieved from https://ieeexplore.ieee.org/document/8295029

ขนาดอนพต (𝑊input × 𝐻input × 𝐷input) จะถกก าหนดโดยความกวาง, ความสงและความลก โดยปกตแลวขนาดความกวางและความสงจะมขนาดเทากน ทชนอนพต (Input Layer) ความลกของอนพตจะมาจากจ านวน Color depth เชน หากเปนภาพส RGB ความลก (𝐷input ) จะเทากบ 3 และในชนทลกขน (Hidden Layer) ความลก (𝐷input ) จะเทากบจ านวนฟลเตอรทใชในชนกอนหนา

ทชนคอนโวลชน(Convolution Layer)จะมพารามเตอรส าหรบฟลเตอรดงตอไปน จ านวนฟลเตอร (𝐾) จ านวนฟลเตอรทใช จะสงผลตอความลกของเอาตพต (Feature

Map/Activation Map) ดงทแสดงในภาพประกอบท 5 ความลกของเอาตพต (12 Activation map)จะเทากบจ านวนฟลเตอรทใช (12 Filter)

ขนาดฟลเตอร (𝐹 × 𝐹) เปนการก าหนดขนาดความกวางและความสงของฟลเตอร เชนฟลเตอรขนาด 3x3, 5x5, 7x7, 11x11

Stride (𝑆) ฟลเตอรจะมการขยบเพอด าเนนการคอนโวลชนกบอนพต ดงนนจะตองมการก าหนดวาขนาดของ Stride เพอก าหนดการขยบของฟลเตอร

Zero-Padding (𝑃) คอการก าหนดวาใหมการเตม 0 เขาไปทบรเวณขอบของอนพตหรอไม ปกตแลวถาไมมการท า padding ผลทไดจากการคอนโวลชนจะท าใหไดฟเจอรแมพทมขนาดเลกลงกวาขนาดอนพต จงมทางเลอกในการท า padding ในกรณทตองการรกษาขนาดของ

Page 27: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

12

ฟเจอรแมพไมใหหดลงและจ านวน padding จะหาไดจากสมการท 12 เมอตองการรกษาขนาดของเอาตพตใหเทากบขนาดของอนพต

𝑝 =𝑓 − 1

2

เอาตพต(Output) ทไดจากการท าคอนโวลชนจะเรยกวา ฟเจอรแมพหรอแอคทเวชนแมพ

(Feature Map; Activation Map) ซงจะมขนาดเปน (𝑊output × 𝐻output × 𝐷output) โดยท

Woutput = ((Winput − F + 2P)/S) + 1 𝐻output = ((𝐻input − 𝐹 + 2𝑃)/𝑆) + 1

𝐷output = 𝐾

ผลทไดจากการท าคอนโวลชนจะตองฝานฟงกชนกระตน (Activation Function) เพอท าการปรบคาทไดจากการท าคอนโวลชนและสงตอไปเปนอนพตในชนถดไป โดยฟงกชนกระตนทนยมใชใน CNN มหลายฟงกชน เชน ฟงกชนเรคตไฟดเชงเสน (ReLU) ภาพประกอบท 6 แสดงคาทไดหลงผานฟงกชนฟงกชนเรคตไฟดเชงเสน

ภาพประกอบ 6 ผลลพธทไดจากฟงกชนเรคตไฟดเชงเสน (ReLU)

2.3.2 ชนพลลง (Pooling Layer) ชนพลลง (Pooling Layer) มกวางตอจากชนคอนโวลชน จะถกใชเพอลดขนาดของฟเจอร

แมพ (Feature Map, Activation Map) กลาวคอฟเจอรแมพทไดจากชนคอนโวลชน จะถกสงไปยง ชนพลลงเพอท าการลดขนาดความกวางและความสง ท าใหขอมลทจะสงไปยงชนถดไปท าใหเปนการมขนาดเลกลง ซงจะปนการลดพารามเตอรไปดวย

(13)

(12)

Page 28: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

13

ภาพประกอบ 7 Pooling Operation

ทมา: CS231n Convolutional Neural Networks for Visual Recognition. (n.d.). Retrieved, from http://cs231n.github.io/convolutional-networks/#architectures

ในชนพลลงจะรบขอมลเขาซงจะมขนาดเปน (𝑊input × 𝐻input × 𝐷input) และจะมพารามเตอรทตองก าหนดดงตอไปน

Pool size ขนาดของพล (𝐹 × 𝐹) Stride (𝑆) เพอก าหนดการขยบของ Pool เอาตพตทจากชนพลลงจะมขนาดเปน (𝑊output × 𝐻output × 𝐷output) โดยท

𝑊output = ((𝑊input − 𝐹)/𝑆) + 1

𝐻output = ((𝐻input − 𝐹)/𝑆) + 1 𝐷output = 𝐷input

การด าเนนการบนชนพลลงสามารถท าได 2 วธคอพลคามากทสด(Max Pooling) และพล

คาเฉลย (Average Pooling)

(14)

Page 29: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

14

ภาพประกอบ 8 การท าพลลง

ทมา: CS231n Convolutional Neural Networks for Visual Recognition. (n.d.). Retrieved, from http://cs231n.github.io/convolutional-networks/#architectures

จดประสงคของชนคอนโวลชนและชนพลลงนนกเพอท าการสกดฟเจอรจากภาพ โดยในชนซอนแรกๆ จะไดพเจอรระดบลางเชน เสน ในชนทลกขนลงไปกจะเปนการสกดฟเจอรทซบซอนขน ซงจ านวนชนคอนโวลชนและชนพลลงทเพมขนกจะสงผลใหความลกของโครงขายทเพมขน

ภาพประกอบ 9 โครงสรางอยางงายของ CNN

2.3.3 ชนเชอมโยงสมบรณ Fully Connected Layer ชนเชอมโยงสมบรณ (Fully Connected Layer ) จะอยในสวนทายของเครอขายซงอาจจะ

ม 1-2 ชนกอนสงขอมลเขา Softmax Function โดยใหทก Neuron ในชนนจะตอกบฟเจอรแมพกอนหนาแบบ Fully-Connected โดยจะตองท าการ (Flatten) ใหเปนเวคเตอรหนงมตกอน

Page 30: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

15

2.3.4 ฟงกชนซอฟตแมกซ (Softmax function) ฟงกชนซอฟตแมกซ (Softmax function) จะถกวางไวทชนสดทายเพอหาความนาจะเปน

ของแตละคลาส คลาสทมความนาจะเปนสงสดคอผลการท านาย จากสมการท 15 คะแนนความนาจะเปนของแตละคลาส. โดย 𝑧𝑖 คอ logit score ในเวคเตอร 𝑧 ความนาจะเปนของแตละคลาสหาไดจากเอกซโพเนนเชยลของ logit หารดวยผลรวมของเอกซโพเนนเชยลของ logit ทกตว ผลลพธทไดคอคะแนนความนาจะเปนของคลาส ซงผลรวมของความนาจะเปนของทกคลาสจะมคาเทากบ 1

𝑠𝑜𝑓𝑡𝑚𝑎𝑥(zi) =exp(𝑧𝑖)

∑ exp(𝑧𝑘)𝐾𝑘=1

2.4 Residual Networks (ResNet) สถาปตยกรรมเปนตวก าหนดโครงสรางในแตละชนจะมการตอกนอยางไรหรอใชฟงกชนกระตนแบบไหน ขนาดฟลเตอรเปนเทาไหร โดยมสถาปตยกรรมหลายๆตวทมชอเสยงและท าประสทธภาพไดดทสด ณ ชวงเวลานน (state of the art) เชน AlexNet, GoogLeNet, VGG เปนตน สถาปตยกรรมใหมๆทถกน าเสนอมประสทธภาพดขนจะมาพรอมกบความลกทมากขน(เพมชนซอนมากขน) อยางไรกตามมงานวจยทแสดงใหเหนวาเมอความลกเพมขนถงจดหนงประสทธภาพกลบไมไดดขน หนงในสาเหตส าคญกคอการ Optimization เชน ปญหา gradient vanishing สงผลใหคาเกรเดยนตสญหาย เปนตน Residual Networks (ResNet) (He, Zhang, Ren, & Sun, 2015) เปนสถาปตยกรรมหนงทมการออกแบบทส าคญทท าใหไดประสทธภาพดถงแมวาจะมความลกมากกตาม โดยไดน าเสนอเทคนคท เรยกวา skip connection ภาพประกอบท 11 แสดงโครงสรางของ ResNet ซงเปนโครงสรางทประกอบขนจาก Residual block ตอกน ResNet สามารถใหประสทธภาพดถงแมจะมความลกมากขนกตาม โดยโครงสรางทแสดงในภาพคอ ResNet18 ซงมความลก 18 ชน และสามารถสรางใหลกขนได เชน ResNet50, ResNet152 ทมความลกถง 50 และ 152 ชนตามล าดบ

2.4.1 Residual Blocks Residual Blocks ใชวธการท า Skip Connection เปนทางลดเพอใชขามชนคอน

โวลชนในบางชน เนองจากการคอนโวลชนในบางชนอาจไมมความจ าเปนคาถวงน าหนก สามารถใหเปน 0 ได โดยทขอมลเขากจะสงผานไปชนถดไปไดโดยไมมการสญหาย

(15)

Page 31: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

16

ภาพประกอบท 10 แสดงโครงสรางของ Residual Block (รปขวา) เทยบกบแบบปกตทไม ม Skip Connection (รปซาย) เมอ 𝑋 คอขอมลเขา ขอมลเขาจะผานการถวงน าหนก

𝑓(𝑥) แลวสงตอไปยงฟงกชนกระตน แตในกรณของ Residual Block ขอมลเขาถวง น าหนกแลวจะน ามารวมกบขอมลเขาอกท 𝑓(𝑥) + 𝑥 กอนสงไปฟงกชนกระตน

ภาพประกอบ 10 Residual block

2.4.2 ResNet Model ResNet จะมโครงสรางทประกอบขนจาก residual block ตอกน ดงทแสดงใน

ภาพประกอบท 11 ทชนแรกของโครงขายจะใชฟลเตอรขนาด 7x7 และใหเอาทพตเปน 64 และก าหนด stride เปน 2 ตามดวยการท า Batch Normalization และการท าพลลง คาสงสด (Max pooling) ในชนตอๆไปจะประกอบขนจาก Residual Blocks ซงม โครงสรางขางในประกอบดวยประกอบขนดวย ชนคอนโวลชนทใชฟลเตอรขนาด 3x3, Batch Normalization และ ฟงกชนกระตนเรคตไฟดเชงเสน (ReLU) ดงทแสดงใน ภาพประกอบท 11 (ซาย) และในสวนทายของโครงขายจะท าพลลงแบบคาเฉลย (Average pooling) กอนจะเขาสขนตอนการจ าแนก (classification) ตอไป

Page 32: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

17

ภาพประกอบ 11 โครงสรางของ ResNet

Page 33: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

18

2.4 One-Class Support Vector Machine One-Class Support Vector Machine (OC-SVM) (Schölkopf, Williamson, Smola,

Shawe-Taylor, & Platt, 2000) ถกพฒนามาจาก Support Vector Machine เพอใชในงาน Anomaly Detection โดยมแนวคดใหท าการฝกแบบจ าลองดวยชดขอมลทมเพยงขอมลปกต (normal data) และจะน าไปใชตรวจจบขอมลผดปกต (Anomaly) เมอมขอมลใหมเขามา (new observation) ภาพประกอบท 14 แสดงใหเหน Decision boundary ของ OC-SVM เมอจดสเทาคอขอมลทใชในการฝกแบบจ าลอง (training observation) วงกลมคอ decision boundary ทจะเปนตวแบงระหวางขอมลปกตกบขอมลผดปกต หากขอมลใหมทโมเดลยงไมเคยเหนมากอนเขามาแลวแลวอยภายใน decision boundary กจะถกจ าแนกเปนขอมลปกต(จดสเขยว) ในทางตรงกนขามหากขอมลใหมตกอยนอก decision boundary แสดงวาเปนขอมลทผดปกต(จดสแดง)

ภาพประกอบ 12 Decision boundary

2.5 Isolation Forest Isolation Forest (F. T. Liu, K. M. Ting, & Z.-H. Zhou, 2008) เปนเทคนคทใชในการ

ตรวจจบสงผดปกต (Anomaly Detection) มโครงสรางทเปน Tree ทท าหนาทแบงขอมล (Partitioning) จนขอมลแตละตว (Instance) แยกออกจากขอมลทเหลอ (Isolated) การท างานของของ Isolation Forest จะเรมจากการแบงขอมล(Partitioning) ซงการ partitioning เรมจากการเลอกฟเจอร (Feature) มาแลวท าการสมคาระหวางคานอยทสดและมากทสดของฟเจอรทเลอกมาและคาทสมมาไดนจะใชในการแบงขอมล โดยกระบวนการ Partitioning จะถกท าซ าจนกระทงแตละ Instance แยกออกจาก Instance ทเหลอ การ Partitioning ท าใหไดโครงสรางแบบ Tree โดย Instance ทผดปกตจะม path จาก root node ทสนกวา Instance ปกต

Page 34: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

19

จากภาพประกอบท 15 เมอ 𝑋𝑖 เปนขอมลปกต (normal point) ซงจะตอง Partitioning ถง 12 ครงถงจะ Isolated ในขณะท 𝑋0 ซงเปน anomaly จะ Partitioning เพยง 4 ครง

ภาพประกอบ 13 Isolation Forest Partitioning

2.6 การวเคราะหองคประกอบหลก (Principal Component Analysis) การวเคราะหองคประกอบหลก (Principal Component Analysis; PCA) เปนวธทใชใน

การลดจ านวนมตของขอมล (Dimensionality Reduction) ใหมขนาดทเหมาะสมทยงสามารถอธบายขอมลนนได สมมตใหขอมลมตวแปรจ านวนมากเชนมตวแปรจ านวน n ตว จากนน PCA จะท าการสรางเซตของตวแปรใหมซงเปนฟงกชนของตวแปรเดม n ตว โดยจะดงรายละเอยดหรอความแปรปรวนจากตวแปรเดมมาไวในตวแปรใหมใหไดมากทสด

PCA ไดถกน ามาใชในการคดเลอกฟเจอร (Feature Selection) เพอใหไดฟเจอรใหมไปใชในขนตอนการเทรนโมเดลดวย learning algorithm ใด ๆ แทนทการใชฟเจอรทงหมด โดย PCA จะแปลงขอมลทมฟเจอรจ านวนมากใหมจ านวนฟเจอรนอยลง สงผลใหใชเวลาในการประมวลผลและวเคราะหนอยลง

ภาพประกอบ 14 ขนตอนการลดมตขอมลดวย PCA

Page 35: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

20

ส าหรบขนตอนการท า PCA จะประกอบดวย 5 ขนตอนหลก ดงทแสดงในภาพประกอบท 16 ในขนตอนแรกคอการเตรยมขอมลโดยการท านอมลไลซ หากความแปรปรวนของตวแปรในขอมลแตกตางกนอยางมนยส าคญ สามารถท าไดโดยใหแตละตวแปรหารดวยคาเบยงเบนมาตรฐาน จากนนในขนตอนท 2 จะเปนการค านวณหา covariance/correlation matrix เพอน าไปค านวณหา eigenvectors และ eigenvalues ในขนตอนท 3 โดยท eigenvalues จะเปนคาทบอกถงความความส าคญของแตละ eigenvectors (คา eigenvectors จะถกเรยงจากมากไปนอยตาม eigenvalues) ในขนตอนท 4 จะเปนการเลอก eigenvectors ทมคา eigenvalues สงตามล าดบ และ eigenvectors ทเลอกทงหมดจะน าไปสรางเปนชดขอมลใหม

2.7 งานวจยทเกยวของ งานวจยทเกยวของทผ วจยไดศกษาสามารถแบงออกได 3 กลมไดแก งานวจยลม CNN-Based Image Classification จะเปนการศกษาสถาปตยกรรมและปญหาของโครงขายประสาทเทยมแบบคอนโวลชน , งานวจยท เกยวของกลม Open-set classification ทงแบบ traditional machine learning based และ deep learning based, งานวจยท เกยวของกลม Anomaly detection โดยหากพจารณางานวจยทเกยวของทงหมดในกลม Open-set classification และ Anomaly detection จากขอมลทใชในการฝกฝนแบบจ าลอง จะสามารถแบงงานวจยไดออกเปน 2 กลมยอย

(1) ใชขอมล known class เทานนในการฝกฝนแบบจ าลอง (2) ใช ขอมล know class และ unknown class ในการฝกฝนแบบจ าลอง โดยท

unknown class ค อต วอย า ง ข อม ลท ใ ช แทน unknown class ซ งอาจจะ เป นขอมลภาพจรง หรอเปนภาพทไดจากการสงเคราะห

ผวจยไดแสดงรายละเอยดงานวจยทเกยวของทงหมดดงตอไปน 2.7.1 งานวจยกลม CNN-Based Image Classification

Anh Nguyen Jason Yosinski และ Jeff Clune (Bendale & Boult, 2015) น าเสนองานวจยทไดทดลองหาวธเพอหลอก Deep Neural Network-Based Classifier ดวยภาพทท าการสงเคราะหขนมาใหม ซงเปนภาพทไมสามารถแยกแยะประเภทไดดวยตามนษย ผลการทดลอง

Page 36: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

21

พบวาสามารถหลอก Classifier ดวยคะแนน Confidence ทสง ซงจรงๆแลวภาพเหลานไมไดเปนภาพทอยในคลาสใดเลย

Alex Krizhevsky, Ilya Sutskever, และ Geoffrey Hinton (Krizhevsky et al., 2012) น าเสนอบทความวจยเรอง ImageNet Classification with Deep Convolutional Neural Networks โดยงานวจยนนบเปนผลงานชนส าคญทท าให CNN เปนทสนใจของนกวจย โดยน าเสนอ AlexNet ซงเปน CNN Based Architecture ตวแรกทสามารถเอาชนะในการแขงขน ImageNet Large Scale Visual Recognition Challenge (ILSVRC) โดยสามารถท าคะแนนไดสงกวาเทคนคแบบดงเดม AlexNet ซงเปน CNN ตวแรกๆทออกแบบมาเพอประมวลผลดวย GPU มจดเดนทใช filter ขนาดใหญ (11x11) , ประกอบดวย 8 hidden layer และเปน CNN โมเดลแรกทใช Rectified Linear Units (ReLUs) เปน Activation Function งานวจยนยงไดใชเทคนคการท า Data Augmentation ใหเกดความหลากหลายของภาพ ซงชวยใหลดปญหา overfit ได

Karen Simonyan และ Andrew Zisserman (Simonyan & Zisserman, 2014) ไดน าเสนอโมเดล VGG ซงใชเทคนคการออกแบบทแตกตางไปจาก AlexNet โดยท าการลดขนาดของ filter เปน 3x3 (AlexNet ใช filterขนาด 11x11) แตใชการเพมความลกใน hidden layer เขาไปเปน 16-19 layer ผลทไดคอประสทธภาพดขนความแมนย าทสงขน

ในงานวจยหลง AlexNet จะเหนไดวาความลกของ hidden layer นนมการเพมขนมาโดยตลอดหลายป ความลกทเพมขนนสงผลใหความแมนย าสงขน แตเมอจดนงความแมนย าจะลดลง อนเนองมาจากปญหาคาเกรเดยนตสญหาย (gradient vanishing)

Kaiming He, Xiangyu Zhang, Shaoqing Ren และ Jian Sun (He et al., 2015) ไดน าเสนอ CNN Architecture ทสามารถมความลกมากและม Accuracy สงมากได โดยม hidden layer สงสดถง 152 layer และแกปญหา gradient vanishing ดวยเทคนค skip connection, batch normalization ท าใหไดความแมนย าสง ถงแมจะเปนโมเดลทมความลกมากกตาม

Jonathan Huang และคณะ (Huang et al., 2016) ไดน าเสนองานวจยนเปนการศกษาและเปรยบเทยบประสทธภาพทงในแงความเรวและความแมนย าของ Object Detector โดยเลอก Detector ทใช Meta Architecture เปน SSD (Single Shot Multibox Detector) , Faster R-CNN) และ R-FCN (Region-based Fully Convolutional ซง Meta Architecture เหลานพฒนาบนพนฐานของ Convolution Neural Network ส าหรบการตรวจจบวตถ โดยใช CNN Architecture อยาง Inception , VGG , Resnet ,Mobile Net ในการท า Feature Extraction โดยผลการศกษาการเปรยบเทยบ Accuracy กบเวลาการประมวลผล (GPU Time) พบวา Faster

Page 37: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

22

RCNN ทใช Inception Resnet V2 เปน Feature Extractor ให Accuracy สงสด ตามดวย Faster RCNN ทใช Resnet เปน Feature Extractor ซงใชเวลาในการประมวลผลนานทสดตามล าดบ สวน SSD ทใช Feature Extractor เปน MobileNet

Data Augmentation (Krizhevsky et al., 2012) ถกใชเพอเพมจ านวนตวอยางรปโดยอาศยรปเดมมาปรบซงสามารถท าไดโดยหลายวธเชนท า Transforms โดยการท า Flip Horizontal, Flip Vertical, การปรบขนาดหรอเลอกมาบางสวน (Random Crops/Scale) การขยบภาพ, (Translation) , Rotation หมนภาพ , ยดภาพออก (Stretching), การเฉอนภาพ (Shearing) รวมถงการปรบคา RGB หรอ การปรบ Contrast (Wong, Gatt, Stamatescu, & McDonnell, 2016) ตวอยางของการท า Data Augmentation แสดงในภาพประกอบท 4 และนอกจาก Data Augmentation จะถกใชมาเพอเพมจ านวนตวอยางรปแลว ยงมประโยชนในการลด Overfitting อกดวย

ภาพประกอบ 15 Data Augmentation

ทมา: How to Configure Image Data Augmentation When Training Deep Learning Neural Networks. (n.d.). Retrieved from https://machinelearningmastery.com

Page 38: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

23

2.7.2 งานวจยกลม Open-set classification Walter J. Scheirer และคณะ(Scheirer et al., 2013) ไดท าการศกษาปญหา Open-set

และไดนยามทฤษฎทนาสนใจหลายหวขอเชน การหาความซบซอนของปญหา (openness score), Open-set risk minimization และยงน าเสนออลกอรทมหลายตว เชน 1-vs-set machine algorithm ซงพฒนามาจาก SVM กลาวคอ 1-vs-set machine จะใช 2 hyperplane โดยท hyperplane แรกจะไดมาจาก SVM และ hyperplane อกอนจะสรางใหขนานกบ hyperplane แรก ขอมลทน ามาทดสอบใดทอยระหวาง 2 hyperplane จะจ าแนกใหเปน target class (known class) สวนขอมลทอยนอก 2 hyperplane จะถกจ าแนกเปน unknown class

Abhijit Bendale และคณะ (Bendale & Boult, 2015) ไดน าเสนอวธการแกปญหา Open-set บน Deep Neural Network โดยงานวจยนสะทอนใหเหนวาทชน SoftMax Layer เปนปญหาและตองปรบเปลยนเพองาน Open-set classification จงน าเสนอ OpenMax และ Multi-class Meta-Recognition เพอใชในการค านวณหา class score แทนท SoftMax function ท าใหสามารถระบ unkown class ไดดขนเมอเปรยบเทยบกบ 1-vs-set machine OpenMax ยงถกน าไปพฒนาตอในงานของ Zongyuan Ge และคณะ (Ge, Demyanov, Chen, & Garnavi, 2017) ทไดน าเสนอ G-OpenMax โดยน าเอา OpenMax ไปใชรวมกบ Generative Adversarial Networks (GANs) (Goodfellow et al., 2014) เพอท าการสงเคราะหภาพ unknown class ขนมา (synthetic image) ดงนนภาพ known class และ ภาพ unknown class จะถกใชในการเทรนโมเดล ซงจะแตกตางจาก OpenMax เดมทจะใชแคภาพ known class รวมกบ EVT ในการประมาณคาความนาจะเปน

Lawrence Neal, Matthew Olson และคณะ (Neal, Olson, Fern, Wong, & Li, 2018) ไดน าเสนอการแกปญหาโดยใชเทคนค data augmentation รวมกบ GANs ในการสรางภาพสงเคราะหภาพทมลกษณะคลายกบภาพตนฉบบ (counterfactual image) โดยใชภาพในชดขอมลทเปนคลาสทรจก (known class) เปนตนฉบบในการสรางภาพแบบคลาย ภาพทสงเคราะหขนมาจะไมถกจดใหอยไปรวมในคลาสทรจก (known class) คลาสใด แตจะเปนคลาสพเศษทเพมขนมาอกคลาสเพอใชในการเทรน ผลการทดลองแสดงใหเหนประสทธภาพทดกวา Open-Max และ G-OpenMax บนชดขอมล CIFAR10, CIFAR50 และ TinyImagenet

Lei Shu, Hu Xu และคณะ (Shu, Xu, & Liu, 2018) ไดใชเทคนคการท า classification แบบ open-set โดยน าเสนอ joint model framework ทประกอบดวยการท า classification,

Page 39: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

24

auto-encoding และclustering ผลทไดคอนอกจากจะสามารถจ าแนกคลาสทไมรจก unknown class แลวยงสามารถจดกลม (clustering) คลาสทไมรจกไดอกดวย

Kumar Sricharan และ Ashok Srivastava (Sricharan & Srivastava, 2018) ไดน าเสนอการสราง Classifiers เพอใหสามารถท านาย sample ทอยนอกกลม (out-of-distribution) โดยไดใช GAN เพอสราง out of distribution sample ทจะใชส าหรบการเทรนโมเดล GANs โมเดลทเลอกใชไดแก Standard GAN, ConfGAN, DCGAN, BoudaryGAN มาสราง out of distribution sample เพอใชเทรนบน VGGNet และชดขอมลทใชคอ MNIST, CIFAR10, SVHN, ImageNet 2.7.3 งานวจยกลม Anomaly Detection

Bernhard Schölkopf และคณะ (Schölkopf et al., 2000) ไดน าเสนอ One-Class Support Vector Machine (OC-SVM) ซงเปนเทคนคทพฒนาจาก Support Vector Machine โดยจะใชเพยงแคขอมลปกต (normal data) ในขนตอนการ training และใชโมเดลนเพอหาขอมลทผดปกตในขนตอนการ testing รายละเอยดไดกลาวไวในหวขอท 2.4 Tax และคณะ ไดน าเสนอ Support Vector Data Description (SVDD) (Tax & Duin, 2004) โดยไดรบอทธพลมาจาก SVM ในขนตอนการ training ของ SVDD จะเปนการคนหา hyper-sphere ทเลกทสด (minimum radius) ทสามารถบรรจขอมล inlier ได เมอมขอมลใหม (new observation) หากตกอยใน hyper-sphere กจะถอเปนขอมลปกต แตหากตกอยขางนอก hyper-sphere กจะถอวาเปนขอมลผดปกต

Fei Tony Liu, Kai Ming Ting และ Zhi-Hua Zhou (F. T. Liu, K. M. Ting, & Z. Zhou, 2008) ไดน าเสนอ Isolation Forest ส าหรบการท า Anomaly Detection โดยใชเทคนคการ partitioning ขอมลเพอสรางเปน tree และใชความลกของ tree เพอหาวาขอมลใดเปน Anomaly รายละเอยดไดกลาวไวในหวขอท 2.5 นอกจากงานวจยท เปน traditional machine learning based แลว ยงมงานวจยทใชเทคนค deep neural netework อกหลายงานวจยเชน

Poojan Oza และ Vishal M. Patel (Oza & Patel, 2019) ไดน าเสนอการท า OC-CNN (One-Class Classification บน Convolution Neural Network) โดยน า Pre-trained AlexNet และ VGG มาปรบโครงสรางในบาง Layer และใชการ generate sample ส าหรบ negative class ขนมา กลาวคอท Layer ทาย เมอ flatten activation map เปน feature vector แลวจะยงไมสงไปชน Softmax Layer ทนท แตจะน าไปรวมกบ pseudo-negative class data ท generate ขนมา

Page 40: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

25

จาก Gaussian Function กอนแลวจงสงไป Softmax Layer ในการทดลองไดใชชดขอมลภาพ Abnormality-1001 , UMDAA-02 Face และ FouderType-200 และเปรยบเทยบประสทธภาพกบวธการอนไดแก OC-SVM (One-Class Support Vector Machine) , BSVM (Binary SVM) , MPM (MiniMax Probability Machine), SVDD (Support Vector Data Description), OC-NN (One-Class Neural Network) และ OC-SVM+ ผลการวจยพบวา OC-CNN และ OC-SVM+ ใหประสทธภาพสงสดสดใกลเคยงกนกบทง 3 ชดขอมล ทงบน AlexNet และ VGGNet

Mohammad Sabokrou และคณะ (Sabokrou, Khalooei, Fathy, & Adeli, 2018) ไดน า Generative Adversarial Networks (GANs) มาประยกตเพอท า Novelty Detection โดยใช Deep Neural Network 2 ตว โดย Network แรกเรยกวา Refine (R) และ ตวทาสองคอ Detector (D) มหลกการท างานคอ R Network จะท าการ reconstruct ขอมลใดๆ ในกรณทขอมลนนเปน positive sample แลว R จะท าการ reconstruct เพอใหขอมลใหมทมคาความนาจะเปน positive class สงขน แตถากรณทขอมลเปน negative sample (outlier) R จะไมสามารถท า Reconstruct ไดดนกท าใหคาความนาจะเปน positive class ลดลดนนเอง จากนนขอมลทผานการ reconstruct แลว จะสงตอไปยง Network D เพอท าการแยก positive sample กบ negative sample ในการทดลองไดใชชดขอมล MNIST และ Caltech-256 โดยมการสมภาพจาก Categories อนเขามาใส เพอใหเปนภาพ Outlier ผลการวจยพบวาสามารถ detect outlier ทไมไดอยในคลาสทใชเทรนไดดและเมอเทยบกบวธอน ๆ แลวมประสทธภาพทดกวา

Raghavendra Chalapathy, Aditya Krishna Menon และ Sanjay Chawla (Chalapathy, Menon, & Chawla, 2018) ไดน าเสนอ OC-NN (One-Class Neural Network) โมเดลส าหรบการท า Anomaly Detection โดยการสราง Feed Forward Network และใช OC-SVM (One-Class Support Vector Machine) มาใชเสมอนเปน loss function ในกระบวนการเทรนโมเดล และไดน าเสนอ alternating minimization algorithms เปน optimizer วธการทงานวจยนไดน าเสนอจะแตกตางจากวธแบบไฮบรด ทจะใช autoencoder, GANs เพอใหได feature แลวคอยสงตอไปให Detector ตรวจสอบวาเปน anomaly หรอไม ซงแตกตางจาก OC-NN ตรงท feature ทไดจาก hidden layer จะถกสรางขนเพอการท า anomaly detection ในการทดลองไดใชชดขอมล Synthetic,MNIST,CIFAR-10,GTSRB และไดเปรยบเทยบกบวธการอน ทใช Deep Learning เชน Robust Convolutional Autoencoder, Deep Convolutional Autoencoder (DCAE) หรอวธแบบเชงเสนเชน OC-SVM/SVDD ผลทไดคอ OC-NN มประสทธภาพใกลเคยงและดกวากลม OC-SVM/SVDD ในบางกรณ

Page 41: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

บทท 3

วธด าเนนงานวจย

ในการท าวจยครงนผวจยผวจยไดด าเนนการตามขนตอนดงน 1. การเตรยมขอมลส าหรบการวจย 2. การสรางแบบจ าลองการจ าแนกภาพ 3. การวดประสทธภาพและวเคราะหผล

3.1 การเตรยมขอมลส าหรบการวจย ในงานวจยนผ วจยไดสรางชดขอมลเครองดม ซงไดมาจากสกดมาจากภาพถายตแชสนคาในประเทศไทยโดยภาพถายเหลานถกถายดวยกลองสมาทโฟน ตวอยางภาพถายแสดงในภาพประกอบท 16

ภาพประกอบ 16 ภาพถายตแชตนฉบบ

Page 42: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

27

ภาพประกอบ 17 แสดงขนตอนสรางชดขอมล

เนองจากชดขอมลเครองดมนเปนชดขอมลทสรางขนมาใหมจงตองมกระบวนการสรางและเตรยมชดขอมลใหไดมาตรฐานตามขนตอนดงตอไปน 3.1.1 ตรวจจบวตถทสนใจ (Object Detection) Object Detection มห นาท เพ อตรวจหาขวดใดๆในภาพถายต แช ดงท แสดงในภ าพ ประกอบท 18 พฒ นาข น ม า โดย ใช Faster R-CNN detector (Girshick, 2015) บน TensorFlow Object Detection API (Huang et al., 2016) และ Detector Model ท างานโดยใช Pre-trained model ท ถก ฝกฝนบนชด ขอมล COCO-dataset (Lin et al., 2014) ภาพขวดทตรวจจบไดจะถกน าไปท าการจดประเภทของภาพ (Labeling)

ภาพประกอบ 18 Object Detection

Page 43: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

28

3.1.2 จดประเภทของภาพ (Labeling) ในขนตอนนจะน าภาพทไดจากขนตอนแรกมาจดประเภท ตารางท 1 แสดงจ านวนภาพขวดเครองดมแยกตามยหอซงมทงหมด 44 ยหอ แตในงานวจยนสนใจเฉพาะเครองดม 3 ยหอไดแก cbd, m150 และ redbull โดยน าภาพ 3 ยหอนจดใหเปน 3 คลาสหลก (Known class)

ไดแก p1,p2 และ p3 ตามล าดบ และเครองดมยหออนๆทเหลอ 41 ยหอจะจดใหเปนภาพในคลาสอนๆ (Other Class) แสดงในภาพประกอบ และ ภาพประกอบท 19 และ 20 ตามล าดบ

ตาราง 1 แสดงจ านวนภาพทสกดไดแยกตามยหอเครองดม

id ยหอ จ านวนภาพ 0 aje big grape 150 1 aje big green 148 2 aje big orange 108 3 aje big strawberry 152 4 c-vitt lemon 151 5 c-vitt orange 164 6 cbd 1027 7 chalarm black galingale 213 8 coke 285 9 est 181 10 est play cream soda 180 11 fanta strawberry 182 12 gsd tang gui jub 327 13 ishiton genmaicha 223 14 jubjai 187 15 kratingdaeng-extra abc 217 16 kratingdaeng-extra zinc 295 17 kratingdaeng-g2 362 18 kratingdaeng-g3 290 19 lipo 200

Page 44: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

29

ตาราง 1 (ตอ)

id ยหอ จ านวนภาพ 20 lipo plus 174 21 lipton 175 22 m-150 storm 252 23 m150 1024 24 mirinda mix-it blueberry 176 25 mirinda mix-it grape 107 26 mirinda orange 204 27 mirinda strawberry 191 28 oishi green tea genmai 188 29 oishi green tea original 215 30 oishi green tea water grape 177 31 oishi green tea water lemon 135 32 pharyanak 137 33 pharyanak herbal 162 34 ranger 133 35 ready 231 36 redbull 1032 37 som in sum 243 38 sponsor 237 39 theoplex-l 357 40 vitamix v1000 111 41 white shark 227 42 yen yen herb 186 43 yen yen honey 193 รวมทงสน 11309

Page 45: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

30

ภาพประกอบ 19 เครองดมคลาส p1, p2 และ p3 ซงเปนคลาสหลก (Known class) ทตองทำการ

จำแนก

ภาพประกอบ 20 ภาพเครองดมในประเภทอนๆ (Other Class) โดยมาจากการน าภาพเครองดม 41 ยหอ ทอยนอกเหลอจาก (Knonw class) มารวมกน

หลงจากกระบวนการจดประเภทของภาพแลว สามารถสรปไดเปน ประเภท p1 จ านวน 1027 รป ประเภท p2 จ านวน 1024 รป ประเภท p3 จ านวน 1032 รป และประเภท other จ านวน 8226 รป

Page 46: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

31

เนองจากจดประสงคของงานวจยนคอสามารถท านายภาพทอยนอกเหนอกลมภาพทใชเทรนโมเดลได (Unknown class) ผวจยจงไดเตรยมชดขอมลอกชด โดยการดงภาพมาจากอนเทอรเนตจ านวน 1,592 รป ซงเปนภาพของเครองดมซงไมมยหอซ ากบ 44 ยหอทใชในการเทรนโมเดล ดงทแสดงในภาพประกอบท 21

ภาพประกอบ 21 ตวอยางภาพขวดเครองดมในกลม Unknown Class

ภาพประกอบ 22 กราฟแสดงจ านวนภาพขวดแยกเปนคลาสตางๆ

Page 47: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

32

3.2 การสรางแบบจ าลองการจ าแนกภาพ จดประสงคของการสรางแบบจ าลองกเพอจ าแนกภาพขวดเครองดมออกเปนคลาสตางๆ และหากขวดเครองดมไมอยในคลาสใดในขนตอนการเรยนรกตองจ าแนกออกเปนคลาสทไมรจกได

𝐷𝑎𝑡𝑎𝑠𝑒𝑡 = {(𝑥1, 𝑦1), (𝑥2, 𝑦2), … , (𝑥𝑛, 𝑦𝑛)}

𝑦𝑖 ∈ {𝑙𝑎𝑏𝑒𝑙1, … , 𝑙𝑎𝑏𝑒𝑙𝑛} จากสมการท 16 ชดขอมล (Dataset) ประกอบขนจากเซตของภาพโดยท

𝑥𝒾 คอ ภาพท 1 ถงภาพท 𝑛 𝑦𝑖 คอ คลาส (known class label) ของภาพท 1 ถงภาพท 𝑛 ภาพ 𝑥𝒾 จะถกจ าแนกออกเปนคลาส(known class label) และสามารถจ าแนกเปนคลาสทไมรจก (unknown class) ในกรณทไมอยในคลาสใด(known class label) ในขนตอนการฝกฝน จากเปาหมายขางตน ผวจยไดออกแบบการทดลองออกเปน 3 โครงสราง เพอท าการทดลองและหาวธการทมประสทธภาพดทสดดงตอไปน

1. N-Binary Classifier 2. N+1 Class Classifier 3. 2 Layer Classification

โดยทระบบทงหมดจะท างานอยบน Google Compute Engine โดยก าหนดความตองการไวเปน Machine type n1-highmem-2 (2 vCPUs, 13 GB memory) ,CPU platform Intel Broadwell, GPUs 1 x NVIDIA Tesla K80 3.2.1 N-Binary Classifier

N-Binary Classifier เปนการฝกแบบจ าลองเทากบจ านวนประเภท (N Classifier) โดยแตละโมเดลจะใชขอมลภาพ 2 ประเภท (Binary Classification) คอภาพประเภททสนใจ 1 คลาสเทานน และภาพประเภทอนๆ ซงท าใหแตละแบบจ าลองจะรบผดชอบในการท านายเพยงแค 1 คลาส ซงค าตอบทไดจะเปนใชหรอไมใชคลาสนนเทานน ดวยวธการฝกฝนแบบจ าลองแบบนท าใหไดแบบจ าลองทงหมด N ชดเทากบจ านวนคลาสทม (known Classes)

(16)

Page 48: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

33

ในขนตอนสดทายคอการสรปการท านายจากทกแบบจ าลอง สามารถสรปไดเปน 3 กรณดงตอไปน

1. กรณททกแบบจ าลอง ท านายวาภาพเปนทไมอยในคลาสใดเลยทใชในขนตอนการฝกฝน(Known classes) จะสามารถสรปไดวาเปนประเภททไมรจก (Unknown Class)

2. กรณทม 1 แบบจ าลอง ท านายวาภาพเปนทอยในกลมคลาสทใชในขนตอนการฝกฝน(Known class) จะสามารถสรปไดวาเปนภาพนนเปนประเภทท Classifier นนท านาย

3. กรณทมมากกวา 1 แบบจ าลอง ท านายวาภาพเปนทอยในกลมคลาสทใชในขนตอนการฝกฝน(Known class) ใหเลอกค าตอบจากแบบจ าลองทมคะแนนความเชอมน (SoftMax probability score) สงทสด

ภาพประกอบท 23 แสดงโครงสรางของ N-Binary Classifier และขนตอนการท านาย

(Prediction procedure) โดยภาพใดๆทใชในการท านาย จะถกจ าแนกออกเปนคลาสใดๆตงแต Class1 – Class N หรอ Unknown Class

ภาพประกอบ 23 N-Binary classifier prediction procedure

ผ วจยไดออกแบบ N-Binary Classifier โดยมทมาจากเทคนค One-vs.-rest ทใชในการท า multi-class class โดยขอมลทใชในการฝกฝนแตละแบบจ าลองจะใชขอมลภาพ known class คอ {𝑝1, 𝑝2, 𝑝3} และใชภาพ other class เพอเปนตวแทนของ unknown class ซงการฝกฝน

Page 49: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

34

แบบจ าลองทภาพ known class รวมกบ unknown class เปนเทคนคทปรากฏอยในหลายๆงานวจยทเกยวของดงทผวจยไดสรปไวในบทท 2

3.2.2 N+1 Class Classifier

N+1 Class Classifier เปนการฝกแบบจ าลองโดยใชขอมลภาพทรจกทงหมด N คลาส (known Classes) และขอมลภาพคลาสเพมเตม (Additional class) อก 1 คลาส ซงจะเปนภาพทอยนอกเหนอจาก N ประเภท (N Classes) โดยในการทดลองคลาสเพมเตมยงสามารถแบงออกไดเปน 2 แบบคอ N+Unknown และ N+Combination

(1) N+Unknown ใชขอมลภาพทรจกทงหมด N คลาส (known Classes) และขอมลภาพประเภทอนๆ (other class) ทใชเปนตวแทนของ unknown class ดงนนในการฝกฝนแบบจ าลองจะใชภาพ {𝑝1, 𝑝2, 𝑝3, 𝑜𝑡ℎ𝑒𝑟}

(2) N+Combination ใชขอมลภาพทรจกทงหมด N คลาส (known Classes) และขอมลภาพคลาสพเศษซงมาจากการน าภาพทงหมด N คลาส (known Classes) มารวมกน ดงนนในการฝกฝนแบบจ าลองจะใชภาพ {𝑝1, 𝑝2, 𝑝3, (𝑝1 + 𝑝2 + 𝑝3)}

ผวจยไดออกแบบ N+1 Class Classifier โดยไดอางองจากงานวจยทเกยวของทใชภาพ unknown class ในการฝกฝนแบบจ าลอง ในกรณ ของ N+Unknown คอการใชภาพทอยนอกเหนอ known class มาเปนตวแทนของ unknown class และในกรณของ Combination ผ วจยไดออกแบบการทดลองโดยสมมตใหไมมตวอยางภาพทจะใชเปนตวแทนของ unknown class อยเลย จะสามารถน าภาพ known class {𝑝1, 𝑝2, 𝑝3} มารวมกนเปนคลาสใหมเพอใชเปนตวแทนของ unknown class ไดหรอไม

3.2.3 2 Layer Classification (Two Layer Classification)

ผวจยไดออกแบบ 2 Layer Classification ภายใตสมมตฐานวาขอมล unknow class กคอขอมลผดปกต(anomaly data) ทสามารถใชการคดกรองโดยใชอลกอรทมอยาง OC-SVM หรอ Isolation Forest ได ดงนน Two Layer Classification จะประกอบขนดวยแบบจ าลองทแบงออกเปน 2 ชน ในชนแรกจะเปนการตรวจสอบวาภาพทใชท านายเปนภาพทเปนภาพทอยในคลาสใด ๆ ในขนตอนการฝกฝนหรอไม โดยใชวธการตรวจหาสงผดปกต (Anomaly detection) หากภาพใดเปนภาพผดปกตกจะถกจ าแนกเปนคลาสทไมรจก (unknown class) แตหากภาพใดเปน

Page 50: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

35

ภาพปกตกจะถกสงไปยงชนทสอง เพอท าการจ าแนกภาพออกเปนคลาส 𝑝1, 𝑝2, 𝑝3 ดงทแสดงในภาพประกอบท 24

ภาพประกอบ 24 Procedure

อยางไรกตามในขนตอนการฝกฝน Two Layer Classification จะมความซบซอนกวาวธ N-Binary Classifier และN+Combination สามารถสรปเปนขนตอนไดตามภาพประกอบท 25 อธบายไดออกเปน 3 สวนคอ Pre-trained model, การสกดฟเจอร(Feature Extraction), การฝกฝนแบบจ าลองส าหรบหาขอมลผดปกต (Train Anomaly Detection)

Page 51: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

36

ภาพประกอบ 25 ขนตอนการฝกฝนของ Multi-class classifier + OC-SVM และ Multi-class classifier + Isolation Forest

1. Pre-trained model Pre-trained model คอแบบจ าลองทถกฝกฝนมาเรยบรอยแลว โดย

ผวจยได เลอกใช pre-trained ResNet50 model จาก Keras Framework ทถก ฝกฝนบนชดขอมล ImageNet

2. Feature Extraction Resnet50 pre-trained model จะถกใชในการสกดฟ เจอร (Feature Extraction) โดยใชภาพจากชดขอมลเครองดม สงเขา pre-trained model ทม การปรบ โครงสรางตามภาพประกอบท 26 แสดงใหเหนวามการปรบโครงสราง

Page 52: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

37

โดยตดชนทใชในการท า classification ออกไป เนองจากฟเจอรทสกดไดนจะใช เพอการสรางโมเดล (Anomaly Detection Model)

3. Anomaly Detection Model ฟเจอรทสกดไดจะเปนขอมลทมหลายมต ดงนนผวจยจงออกแบบใหม การลดมตของขอมล (Dimension Reduction) กอนทถกน าไปใชในการขนตอน การฝกฝน โดยใช OC-SVM และ Isolation Forest

ภาพประกอบ 26 การใช Pre-trained model เพอสกดฟเจอร โดยการตดโครงสรางส ารบการท า classification ออกไป

การใช pre-trained model มาสกดฟเจอรเปนเทคนคทปรากฏในหลายๆงานวจย เชนงานวจยทผวจยสรปมาในหวขอ 2.7.3

ตาราง 2 เปรยบเทยบรปแบบการฝกฝนแบบจ าลอง

รปแบบการฝกฝนและทดสอบ จ านวนแบบจ าลอง หมายเหต N-Binary Classifier N N+1 Class Classifier 1 2-Layer Classification 2 1 anomaly,

1 Image Classification

Page 53: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

38

3.2.3 การวดประสทธภาพและวเคราะหผล ในการวดประสทธภาพของแบบจ าลองทสรางขนดวยเทคนคตาง ๆ เพอดประสทธภาพใน

การจ าแนก รวมถงเวลาทใชการฝกฝนแบบจ าลอง ผวจยไดก าหนดเกณฑในการประเมนประสทธภาพโดยใช Accuracy score, Precision score, Recall score, F-1 Score สามารถค านวณคาไดจากสมการท 17-20 ตามล าดบ

𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = 𝑇𝑃 + 𝑇𝑁

𝑇𝑃 + 𝐹𝑁 + 𝑇𝑁 + 𝐹𝑃

𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = 𝑇𝑃

𝑇𝑃 + 𝐹𝑃

𝑅𝑒𝑐𝑎𝑙𝑙 = 𝑇𝑃

𝑇𝑃 + 𝐹𝑁

𝐹1 = 2 × 𝑃𝑟𝑒𝑐𝑖𝑠𝑠𝑖𝑜𝑛 × 𝑅𝑒𝑐𝑎𝑙𝑙

𝑃𝑟𝑒𝑐𝑖𝑠𝑠𝑖𝑜𝑛 + 𝑅𝑒𝑐𝑎𝑙𝑙

จากสมการ

𝑇𝑃 คอ True Positive 𝑇𝑁 คอ True Negative 𝐹𝑃 คอ False Positive 𝐹𝑁 คอ False Negative

(18)

(17)

(19)

(20)

Page 54: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

บทท 4 การด าเนนการวจยและผลการวจย

ผ วจยไดด าเนนการวจยโดยท าการทดลองตลอดจนการวดประสทธภาพเพอใหบรรลจดประสงคของการวจยทไดก าหนดไว โดยก าหนดการทดลองไวดงตอไปน

1. Based Model (Multi-Class Model) 2. การทดลอง Exploring SoftMax Probability Score 3. การทดลอง N-Binary Classifier 4. การทดลอง N+Unknown Class Classifier 5. การทดลอง N+Combination Class Classifier 6. การทดลอง 2 Layer Classification (OC-SVM)

7. การทดลอง 2 Layer Classification (Isolation Forest) 8. Dimension Reduction

4.1 Based Model (Multi-Class Model) ในการทดลองแรกนผวจยตองการสรางโมเดลโดยมจดประสงคเพอดประสทธภาพของการท านายภาพกลมหลก (known class) กอน จงสรางแบบจ าลองในการจ าแนกภาพขวดโดยใชภาพกลม known class ซงประกอบดวยคลาส 𝑝1, 𝑝2, 𝑝3 เพยงเทานนทงในขนตอนการฝกฝนและทดสอบแบบจ าลองดงนนผลการท านายของแบบจ าลองนทไดจะเปน �� ∈ {p1, p2, p3}. โดยเลอกสถาปตยกรรมแบบ Resnet50 และมการก าหนด hyperparameter เปน batch size = 32, epoch = 25, optimizer = SGD, learning rate = 0.1, Momentum = 0.9, Weight decay = 0.004, Loss function = cross entropy loss ภาพประกอบท 27 แสดง loss และ accuracy ของการ train และ validation ซงจะเหนวาเม อ epoch เพ มข น คา loss จะลดลงและ accuracy กสงข นท งการ train และ validationภาพประกอบท 28 แสดง confusion matrix ซงจะเหนวามประสทธภาพดในทกคลาส Based Model จะน าไปใชตอในการทดลอง Exploring SoftMax Probability Score, 2-Layer Classification (OC-SVM) 2-Layer Classification (Isolation Forest)

Page 55: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

40

ภาพประกอบ 27 train loss, validation loss / epoch และ train accuracy, validation accuracy/epoch

ภาพประกอบ 28 Confusion Matrix ของ Based Multi-class model

Page 56: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

41

ภาพประกอบ 29 Heatmap แสดงจดส าคญของภาพทแบบจ าลองสกดได ของภาพทท านายถกตอง

Page 57: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

42

ภาพประกอบ 30 Heatmap แสดงจดส าคญของภาพทแบบจ าลองสกดได ของภาพทท านายผด

ภาพประกอบท 29 -30 แสดงใหเหนถงบรเวณทส าคญทมผลตอการจ าแนกโดยการน า Activation map ทไดจากชนคอนโวลชนสดทายมาสรางเปน heatmap โดยบรเวณทสวางของภาพใดๆคอบรเวณทมความส าคญทแบบจ าลองสกด จากภาพประกอบท 29 ซงเปนภาพทแบบจ าลองท านายไดถกตองในขนตอนการทดสอบจะเหนวาบรเวณทมความสวางสงคอบรเวณฉลากของเครองดม สวนภาพประกอบท 30 เปนภาพทแบบจ าลองท านายผดในขนตอนการทดสอบ เมอพจารณา heatmap แลวจะเหนวาบรเวณทสวางจะไมใชบรเวณฉลาก

Page 58: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

43

4.2 Exploring SoftMax Probability Score ในการทดลองนเปนการน า Based Model(Multi-Class Model) ซงใหความแมนย าทสงกบขอมลคลาสหลก มาท าการทดสอบเพอท าการส ารวจการกระจายคะแนนความเชอมน เนองจาก Softmax Function จะถกใชในการหาความเชอมนหรอคะแนนความนาจะเปนวาภาพขวดใดๆ จะท านายเปนคลาสใดไดแก 𝑝1, 𝑝2, 𝑝3 และคลาสใดทมคาความนาจะเปนสงทสดกจะเปนค าตอบ ซงคะแนนความนาจะเปนของทกคลาสจะมผลรวมเปน 1 เสมอ ดงนนการทดลองนจะถกออกแบบโดยมจดประสงคเพอส ารวจคะแนนความนาจะเปน ทไดจาก Softmax Function ของภาพกลม unknown class ซงภาพเหลานจะเปนภาพทไมไดเปนภาพคลาสใด ๆ ทง 𝑝1, 𝑝2, 𝑝3 สมมตฐานของการทดลองนกคอ เมอท านายภาพกลม unknown class คะแนนความนาจะเปนของแตละคลาสจะแตกตางกนไมมาก มการกระจายเทาๆกน ถาหากผลทไดเปนไปตามสมมตฐานขางตน กจะสามารถหาชวงคะแนนความนาจะเปนทเหมาะสมเพอท า threshold ในการแยก unknown class ได ดงทแสดงในภาพประกอบท 31 คอตวอยางการกระจายคะแนนตามแบบอดมคต ทสามารถก าหนดคา threshold ไดงาย อยางไรกตามคะแนนความนาจะเปนทไดจรงไมเปนไปตามสมมตฐานดงทแสดงในภาพประกอบท 32,33 และตารางท 3

ภาพประกอบ 31 การก าหนดคา threshold เพอระบ unknown class ในอดมคต

Page 59: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

44

ภาพประกอบ 32 ตวอยางภาพขวดและการกระจายของคะแนนความนาจะเปนของภาพ unknown class

ภาพประกอบ 33 การกระจายของคะแนนของภาพกลม unknown

Page 60: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

45

ตาราง 3 แสดงสถตของคะแนนความเชอมน ของภาพ unknown class จ านวน 1,592 ภาพ

count 1,592 mean 0.929013 std 0.132177 min 0.365441 25% 0.935618 50% 0.998164 75% 0.999943 max 1

ภาพประกอบท 32 แสดงตวอยางของภาพขวดของภาพขวดในกลม unknown class โดยจะเหนวาคะแนนไมไดมการกระจายไปยงคลาส 𝑝1, 𝑝2, 𝑝3 เทาๆกน แตคะแนนความนาจะเปนจะสงมากทคลาสใดคลาสหนงเทานน การกระจายของคะแนนไมเปนไปตามสมมตฐานทวางไว ภาพประกอบท 33 และตารางท 4 แสดงใหเหนการกระจายคะแนนความนาจะเปน ของภาพขวดในกลม unknown class ทงหมด 1,592 ภาพซงภาพเหลานเปนภาพทไมไดอยในคลาสใด จะเหนวาคะแนนความเชอมนสวนใหญจะเกน 99% ซงเปนคะแนนความเชอมนทสงมาก จากผลการทดลองขางตน สามารถสรปไดวา ภาพ unknown class นนถกท านายเปนภาพ known class ซงเปนการท านายทผดดวยระดบคะแนนความเชอมนทสงมาก

Page 61: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

46

ภาพประกอบ 34 แสดงความแมนย าในการจ าแนก unknow และ known class ทระดบ threshold ตงแต 0.1 – 1.0

เมอก าหนดคา threshold ในชวง 0.1-1.0 เพอท าการแยก ภาพ unknown class และ known class (p1,p2,p3) หากคะแนนความเชอมนของภาพใดมคาต ากวาคา threshold ทตงไวกจะถกจ าแนกเปน unknown class ผลการทดลองแสดงใหเหนในภาพประกอบท 33 จะเหนวาการก าหนดคา thresholdท 1.0 ซงเปนคาความเชอมนสงสด จะสามารถแยก unknown class และ known class ทความแมนย า (Accuracy) 64% เทานน ดงนนสามารถสรปไดวาการก าหนด threshold ยงมความแมนย าไมเพยงพอตอการจ าแนก unknow และ known class

4.3 N-Binary Classifier ในการทดลองนจะท าการสราแบบจ าลอง 3 แบบจ าลอง จากชดขอมลเครองดมโดยมรายละเอยดดงตารางท 5 โดยทกแบบจ าลองจะใชสถาปตยกรรมแบบ Resnet50 โดยมการก าหนด hype-parameter เปน batch size = 32, epoch = 25, optimizer = SGD, learning rate = 0.1, Momentum = 0.9, Weight decay = 0.004, Loss function = binary-cross entropy loss

Page 62: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

47

ตาราง 4 N-Binary Classifier Training Procedure

# คลาสทใชฝกฝน วตถประสงค Model 1 p1, other จ าแนกวาเปน p1 หรอ ไมใช p1

�� ∈ {𝑝1, ~𝑝1} Model 2 p2, other จ าแนกวาเปน p2 หรอ ไมใช p2

�� ∈ {𝑝2, ~𝑝2} Model 3 p3, other จ าแนกวาเปน p3 หรอ ไมใช p3

�� ∈ {𝑝3, ~𝑝3} สดทาย N-Binary Classifier จะใชทง Model1, Model2, Model3 รวมกนในการท านายภาพขวดเครองดมโดยใช Decision Function ตามทแสดงในสมการท 21 โดยผลการทายจะเปน �� ∈{𝑝1, 𝑝2, 𝑝3, unknown }

�� =

{

𝑢𝑛𝑘𝑛𝑜𝑤𝑛, ทกแบบจ าลองจ าแนกเปน 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑒

𝑝1, แบบจ าลอง 1 จ าแนกเปน 𝑝𝑜𝑠𝑡𝑖𝑣𝑒 และไดคะแนนสงสด𝑝2, แบบจ าลอง 2 จ าแนกเปน 𝑝𝑜𝑠𝑡𝑖𝑣𝑒 และไดคะแนนสงสด𝑝3, แบบจ าลอง 3 จ าแนกเปน 𝑝𝑜𝑠𝑡𝑖𝑣𝑒 และไดคะแนนสงสด

ภาพประกอบท 35 แสดง loss และ accuracy ในการ train และ validation ของ Model1, Model2, Model3 โดยทง 3 Model มผลทแสดงใหเหนแนวโนมทสอดคลองกนคอ เมอจ านวน epoch เพมขน คา loss จะลดและ accuracy จะเพมขน

(21)

Page 63: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

48

ภาพประกอบ 35 train loss, validation loss / epoch และ train accuracy, validation accuracy/epoch ของ N-Binary Classifier แตละแบบจ าลอง

Page 64: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

49

precision recall F1 unknown 0.998 0.793 0.934 p1 0.580 0.984 0.729 p2 0.581 1 0.735 p3 0.816 1 0.899

ภาพประกอบ 36 Classification Report ของ N-Binary Classifier

ผลการทดลอง N-Binary Classifier แสดงใหประสทธภาพดงทแสดงในภาพประกอบท 36 โดยมคา accuracy โดยรวมคอ 84% และหากพจารณารายละเอยดในการจ าแนกคลาสตางๆโดยอาศยคา precision, recall และ f1 รวมดวย จะสามารถสรปไดดงตอไปน

(1) ประสทธภาพการจ าแนก unknown มาจากการพจารณาคา recall ซงจะเหนวาสามารถตรวจหาภาพ unknown class ได 79% และหากพจารณาคา precision แลวสามารถสรปไดวาภาพทถกท านายเปน unknown ทงหมดมความถกตองท 99% เมอน าคา precision และ recall มาหาคาเฉลยจะไดคา f1 ท 93%

(2) ประสทธภาพในการจ าแนก p1 พจารณาจากการทสามารถตรวจหา p1 ด 98% โดยพจารณาจากคา recall และ คา precision ท 58% แสดงใหเหนความถกตองของภาพทงหมดทถกจ าแนกเปน p1 เมอน าคา precision และ recall มาหาคาเฉลยจะไดคา f1 ท 72%

(3) ประสทธภาพในการจ าแนก p2 พจารณจากความสามารถตวรจหา p2 ได 100% โดยดจากคา recall และความถกตองของภาพทงหมดทถกจ าแนกเปน p2 มาจากคา precision ท 58% เทาน น เม อน าคา precision และ recall มาหาคาเฉลยจะไดคา f1 ท 73%

Page 65: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

50

(4) ประสทธภาพในการจ าแนก p3 พจารณาจากคา recall ทได 100% แสดงใหเหนถงประสทธภาพในการตรวจหา p3 ไดทงหมด แตเมอพจารณาคา precession ท 100% จะเหนวาภาพทถกท านายเปน p3 จะมความถกตองท 81% เทานน เมอน าคา precision และ recall มาหาคาเฉลยจะไดคา f1 ท 89 %

4.4 N+Unknown Class Classifier ในการทดลองน N+Unknown Class Classifier จะถกสรางข นมาโดยใชภาพขวดเครองดม 3 คลาสหลกคอ 𝑝1, 𝑝2, 𝑝3 รวมกบภาพ unknown class แบบจ าลองจะถกสรางโดยใชสถาปตยกรรมแบบ ResNet50 มการก าหนด hyperparameter เปน batch size = 32, epoch = 25, optimizer = SGD, learning rate = 0.1, Momentum = 0.9, Weight decay = 0.004, Loss function = cross entropy loss โด ย โม เด ล ท ไ ด จ ะ ใ ห ผ ล ก า รท า น า ย เป น �� ∈{𝑝1, 𝑝2, 𝑝3, unknown } ภาพประกอบท 37 แสดง loss และ accuracy ในการ train และ validation โดยผลทไดจ คา loss จะลดลงและคา accuracy สงขนตามจ านวน epoch ทเพมขน และ accuracy ท 25 epoch มคาสงกวา 99%

ภาพประกอบ 37 train loss, validation loss / epoch และ train accuracy, validation accuracy/epoch ของ N+Unknown Classifier

Page 66: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

51

precision recall F1 unknown 0.998 0.899 0.953 p1 0.776 0.995 0.872 p2 0.902 0.991 0.944 p3 0.696 1 0.821

ภาพประกอบ 38 Classification Report ของ N+Unknown Class Classifier

ผลการทดลองทไดแสดงในภาพประกอบท 38 คา accuracy โดยรวมคอ 92% และหากพจารณารายละเอยดในการจ าแนกคลาสตางๆโดยอาศยคา precision, recall และ f1 รวมดวย จะสามารถสรปไดดงตอไปน

(1) ประสทธภาพการจ าแนก unknown มาจากการพจารณาคา recall ซงจะเหนวาสามารถตรวจหาภาพ unknown class ได 89% และหากพจารณาคา precision แลวสามารถสรปไดวาภาพทถกท านายเปน unknown ทงหมดมความถกตองท 99% เมอน าคา precision และ recall มาหาคาเฉลยจะไดคา f1 ท 95%

(2) ประสทธภาพในการจ าแนก p1 พจารณาจากการทสามารถตรวจหา p1 ได 99% โดยพจารณาจากคา recall และ คา precision ท 77% แสดงใหเหนความถกตองของภาพทงหมดทถกจ าแนกเปน p1 เมอน าคา precision และ recall มาหาคาเฉลยจะไดคา f1 ท 87%

Page 67: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

52

(3) ประสทธภาพในการจ าแนก p2 พจารณจากความสามารถตวรจหา p2 ได 99% โดยพจารณาจากคา recall และความถกตองของภาพทงหมดทถกจ าแนกเปน p2 มาจากคา precision ท 99% เม อน าคา precision และ recall มาหาคาเฉลยจะไดคา f1 ท 94%

(4) ประสทธภาพในการจ าแนก p3 พจารณาจากคา recall ท 100% แสดงใหเหนถงประสทธภาพในการตรวจหา p3 ไดทงหมด แตเมอพจารณาคา precession ท 69% จะเหนวาภาพทถกท านายเปน p3 จะมความถกตองท 69% เทานน เมอน าคา precision และ recall มาหาคาเฉลยจะไดคา f1 ท 82 %

4.5 N+Combination Class Classifier ในการทดลองน N+Combination Class Classifier จะถกสรางขนมาโดยใชภาพขวดเครองดม 3 คลาสหลกคอ 𝑝1, 𝑝2, 𝑝3 รวมกบภาพกลม Combination ซงมาจากการน าภาพ 𝑝1, 𝑝2, 𝑝3 มารวมกนเปนคลาสใหมเรยกวา combination class แบบจ าลองจะถกสรางโดยใชสถาปตยกรรมแบบ ResNet50 มการก าหนด hyperparameter เปน batch size = 32, epoch = 25, optimizer = SGD, learning rate = 0.1, Momentum = 0.9, Weight decay = 0.004, Loss function = cross entropy loss โดยโมเดลทไดจะใหผลการท านายเปน �� ∈

{𝑝1, 𝑝2, 𝑝3, unknown } loss และ accuracy ของการ train และ validation แสดงในภาพประกอบท 39 ซงจะเหนวาคาทไดจะลดลงหรอเพมขนไมแนนอน หากพจารณาคา train accuracy จะต ากวา validation accuracy เมอจ านวน epoch เพมขนซงแสดงใหเหนแนวโนมของการทแบบจ าลองมการเรยนรมากเกนไป (overfit) โดยผวจยไดสนนษฐานการเกด overfit วามสาเหตมาจาก Combination class ลวนเปนภาพทซ ากบภาพทอยใน {𝑝1, 𝑝2, 𝑝3} ทงสน

Page 68: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

53

ภาพประกอบ 39 train loss, validation loss / epoch และ train accuracy, validation accuracy/epoch ของ N+Combination class classifier

precision recall F1 unknown 0.766 0.695 0.774 p1 0.489 0.789 0.604 p2 0.033 0.029 0.030 p3 0.447 0.541 0.489

ภาพประกอบ 40 Classification Report ของ N+Combination class classifier

ภาพประกอบท 40 แสดงประสทธภาพของ N+Combination Class Classifier โดยมคา accuracy โดยรวมคอ 62% และหากพจารณารายละเอยดในการจ าแนกคลาสตางๆโดยอาศยคา precision, recall และ f1 รวมดวย จะสามารถสรปไดดงตอไปน

(1) ประสทธภาพการจ าแนก unknown พจารณาไดจากคา recall ทแสดงใหเหนวาสามารถตรวจหาภาพประเภท unknown class ได 69% และหากพจารณาคา precision แลวสามารถสรปไดวาภาพทถกท านายเปน unknown ทงหมดม

Page 69: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

54

ความถกตองท 76% เมอน าคา precision และ recall มาหาคาเฉลยจะไดคา f1 ท 77%

(2) ประสทธภาพในการจ าแนก p1 พจารณาจากการทสามารถตรวจหา p1 ได 78% โดยดจากคา recall สวนคา precision จะแสดงใหเหนความถกตองของภาพทงหมดทถกจ าแนกเปน p1 ซงท าไดเพยง 48% เทานน เมอน าคา precision และ recall มาหาคาเฉลยจะไดคา f1 ท 60%

(3) ประสทธภาพในการจ าแนก p2 พจารณจากความสามารถตวรจหา p2 ได 2.9% เทานนโดยพจารณาจากคา recall สวนความถกตองของภาพทงหมดทถกจ าแนกเปน p2 มาจากคา precision ท 3.3% เทานน และเมอน าคา precision และ recall มาหาคาเฉลยจะไดคา f1 ท 3%

(4) ประสทธภาพในการจ าแนก p3 พจารณาจากคา recall แสดงใหเหนถงประสทธภาพในการตรวจหา p3 ท 54% แตเมอพจารณาคา precession ท 44% จะเหนวาภาพทถกท านายเปน p3 จะมความถกตองท 44% เทานน เมอน าคา precision และ recall มาหาคาเฉลยจะไดคา f1 ท 48 %

4.6 2-Layer Classification (OC-SVM and Multi-Class Model) การทดลอง 2-Layer Classification (OC-SVM and Multi-Class Model) จะใช OC-SVM เพอแยกภาพ unknown class และ known class หากภาพใดท OC-SVM ท านายเปน known จะตองน าไปจ าแนกตอโดยใช Multi-Class Model ซงไดมาจาก Based Model (จากการทดลอง 4.1) เพอจ าแนกภาพออกเปนคลาสตางๆดงทแสดงในภาพประกอบท 41

ภาพประกอบ 41 2-Layer Classification (OC-SVM and Multi-Class Model) prediction procedure

Page 70: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

55

ในการสรางแบบจ าลองโดยใช OC-SVM ชดขอมลทใชจะมาจากการใช Keras Pre-trained Resnet50 เพอท าการสกดฟเจอรโดยใชขอมลภาพคลาสหลกคอ 𝑝1, 𝑝2, 𝑝3 ได จากนนน าฟเจอรทสกดไดไปใชฝกฝนแบบจ าลอง ฟเจอรทสกดไดมทงหมด 1000 ฟ เจอรจากภาพ known class ทงหมด 3,083 ภาพ ภาพประกอบท 42 แสดงตวอยางขอมลของฟเจอรทสกดได

ภาพประกอบ 42 ตวอยางฟเจอรทสกดไดจาก Pre-trained ResNet50

ฟเจอรทงหมดจะน าไปเทรน OC-SVM โดยก าหนด hyperparameter เปน nu = 0.5, kernel = rbf, gamma = 0.1 ภาพประกอบท 43 แสดงประสทธภาพของ 2-Layer Classification (OC-SVM + Based Model) โดยมคา accuracy โดยรวมคอ 71% และหากพจารณารายละเอยดในการจ าแนกคลาสตางๆโดยอาศยคา precision, recall และ f1 รวมดวย จะสามารถสรปไดดงตอไปน

(1) ประสทธภาพการจ าแนก unknown พจารณาไดจากคา recall ทแสดงใหเหนวาสามารถตรวจหาภาพประเภท unknown class ได 79% และหากพจารณาคา precision แลวสามารถสรปไดวาภาพทถกท านายเปน unknown ทงหมดมความถกตองท 81% เมอน าคา precision และ recall มาหาคาเฉลยจะไดคา f1 ท 84%

(2) ประสทธภาพในการจ าแนก p1 พจารณาจากการทสามารถตรวจหา p1 ได 47% โดยดจากคา recall สวนคา precision จะแสดงใหเหนความถกตองของภาพทงหมดทถกจ าแนกเปน p1 ซงท าไดเพยง 42% เทานน เมอน าคา precision และ recall มาหาคาเฉลยจะไดคา f1 ท 44%

(3) ประสทธภาพในการจ าแนก p2 พจารณจากความสามารถตวรจหา p2 ได 60% โดยพจารณาจากคา recall สวนความถกตองของภาพทงหมดทถกจ าแนกเปน

Page 71: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

56

p2 มาจากคา precision ท 49% และเมอน าคา precision และ recall มาหาคาเฉลยจะไดคา f1 ท 54%

(4) ประสทธภาพในการจ าแนก p3 พจารณาจากคา recall แสดงใหเหนถงประสทธภาพในการตรวจหา p3 ท 44% แตเมอพจารณาคา precession ท 44% จะเหนวาภาพทถกท านายเปน p3 จะมความถกตองท 61% เทานน เมอน าคา precision และ recall มาหาคาเฉลยจะไดคา f1 ท 51%

precision recall F1 unknown 0.810 0.798 0.840 p1 0.423 0.475 0.448 p2 0.493 0.606 0.543 p3 0.611 0.447 0.516

ภาพประกอบ 43 Classification Report ของ OC-SVM and Multi-class

4.7 2-Layer Classification (Isolation Forest and Multi-Class Model) การทดลอง 2-Layer Classification (Isolation Forest and Multi-Class Model) จะใช Isolation Forest เพอแยกภาพ unknown class และ known class หากภาพใดท Isolation Forest ท านายเปน known จะตองน าไปจ าแนกตอโดยใช Multi-Class Model ซงไดมาจาก Based Mode จากการทดลองท 4.1 เพอจ าแนกภาพออกเปนคลาสตางๆ ในขนตอนการฝกฝนแบบจ าลองกใชฟเจอรเดยวกนกบการทดลองกอหนาน โดยม hyperparameter เปน behavior = new, max_samples =10, contamation = auto, randomstate = 42

Page 72: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

57

ผลการทดลองทไดจะเหนวาประสทธภาพคอนขางต าดงทไดแสดงในภาพประกอบท 45 โดยคา accuracy โดยรวมคอ 29% และหากพจารณารายละเอยดในการจ าแนกคลาสตางๆโดยอาศยคา precision, recall และ f1 รวมดวย จะสามารถสรปไดดงตอไปน

(1) ประสทธภาพการจ าแนก unknown มาจากการพจารณาคา recall ซงจะเหนวาสามารถตรวจหาภาพ unknown class ได 12% และหากพจารณาคา precision แลวสามารถสรปไดวาภาพทถกท านายเปน unknown ทงหมดมความถกตองท 55% เมอน าคา precision และ recall มาหาคาเฉลยจะไดคา f1 ท 29%

(2) ประสทธภาพในการจ าแนก p1 พจารณาจากการทสามารถตรวจหา p1 ได 73% โดยพจารณาจากคา recall และ คา precision ท 22% แสดงใหเหนความถกตองของภาพทงหมดทถกจ าแนกเปน p1 เมอน าคา precision และ recall มาหาคาเฉลยจะไดคา f1 ท 34%

(3) ประสทธภาพในการจ าแนก p2 พจารณจากความสามารถตวรจหา p2 ได 68% โดยพจารณาจากคา recall และความถกตองของภาพทงหมดทถกจ าแนกเปน p2 มาจากคา precision ท 20% เม อน าคา precision และ recall มาหาคาเฉลยจะไดคา f1 ท 30%

(4) ประสทธภาพในการจ าแนก p3 พจารณาจากคา recall ท 81% แสดงใหเหนถงประสทธภาพในการตรวจหา p3 แตเมอพจารณาคา precession ท 36% จะเหนวาภาพทถกท านายเปน p3 จะมความถกตองท 36% เทานน เมอน าคา precision และ recall มาหาคาเฉลยจะไดคา f1 ท 49 %

ภาพประกอบ 44 2-Layer Classification (Isolation Forest + Based Model)

Page 73: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

58

precision recall F1 unknown 0.557 0.126 0.295 p1 0.225 0.733 0.344 p2 0.200 0.683 0.309 p3 0.360 0.812 0.498

ภาพประกอบ 45 Classification Report ของ Isolation forest and Multi-class

4.8 Dimension Reduction การทดลอง OC-SVM และ Isolation Forest ยงใหประสทธภาพทไมดนก ดงนนในขน

ตอไปจะเปนการปรบปรงประสทธภาพ โดยหากพจารณาทจ านวนฟเจอรทสกดไดซงมทงหมด 1000 ฟเจอรจากภาพ known class ทงหมด 3,083 ภาพ จะเหนวาจ านวนมตของของมลสงมาก ผวจยจงไดใชการวเคราะหองคประกอบหลก (PCA) เพอท าการลดมตของขอมล ภาพประกอบท 46 แสดงใหเหน PC1 จะมครอบคลม variance สงสดท 13.31. % และ PC2-PC10 กจะม variance ลดลงตามล าดบ และภาพประกอบท 47 แสดงใหเหนวาเพยงแค 200 component กครอบครม variance เกน 80% จากผลการวเคราะหองคประกอบหลก ผ วจยไดเลอกการลดมตขอมลโดยใชแค 400 component ซงสามารถอธบาย variance ได 93% หลงจากลดมตขอมลแลวกไดน าขอมลทไดเพอไปสรางโมเดลโดยใช OC-SVM, และ Isolation Forest และท า hyperparameter tuning

Page 74: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

59

ภาพประกอบ 46 แสดง variance/components

ภาพประกอบ 47 กราฟแสดง variance/จ านวน component

Page 75: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

60

precision recall F1 unknown 0.921 0.727 0.870 p1 0.493 0.825 0.617 p2 0.492 0.835 0.619 p3 0.679 0.848 0.754

ภาพประกอบ 48 Classification Report หลงท า PCA ของ OC-SVM and Multi-class

precision recall F1 unknown 0.885 0.852 0.8884 p1 0.619 0.748 0.6771 p2 0.652 0.601 0.6253 p3 0.688 0.807 0.7430

ภาพประกอบ 49 Classification Report หลงท า PCA ของ Isolation Forest and Multi-class

Page 76: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

61

หลงจากท า PCA ผลการทดลองทไดจาก Multi-class and Isolation Forest จะเหนวาประสทธภาพดขนในทกตวชวด จากภาพประกอบท 49 แสดงใหเหน accuracy โดยรวมท 85% และหากพจารณารายละเอยดในการจ าแนกคลาสตางๆโดยอาศยคา precision, recall และ f1 รวมดวย จะสามารถสรปไดดงตอไปน

(1) ประสทธภาพการจ าแนก unknown พจารณาไดจากคา recall ทแสดงใหเหนวาสามารถตรวจหาภาพประเภท unknown class ได 85% และหากพจารณาคา precision แลวสามารถสรปไดวาภาพทถกท านายเปน unknown ทงหมดมความถกตองท 88% เมอน าคา precision และ recall มาหาคาเฉลยจะไดคา f1 ท 88%

(2) ประสทธภาพในการจ าแนก p1 พจารณาจากการทสามารถตรวจหา p1 ได 74% โดยดจากคา recall สวนคา precision จะแสดงใหเหนความถกตองของภาพทงหมดทถกจ าแนกเปน p1 ซงท าได 61% เมอน าคา precision และ recall มาหาคาเฉลยจะไดคา f1 ท 67%

(3) ประสทธภาพในการจ าแนก p2 พจารณจากความสามารถตวรจหา p2 ได 60% โดยพจารณาจากคา recall สวนความถกตองของภาพทงหมดทถกจ าแนกเปน p2 มาจากคา precision ท 65% และเมอน าคา precision และ recall มาหาคาเฉลยจะไดคา f1 ท 62%

(4) ประสทธภาพในการจ าแนก p3 พจารณาจากคา recall แสดงใหเหนถงประสทธภาพในการตรวจหา p3 ท 80% แตเมอพจารณาคา precession ท 44% จะเหนวาภาพทถกท านายเปน p3 จะมความถกตองท 68% เทานน เมอน าคา precision และ recall มาหาคาเฉลยจะไดคา f1 ท 74 %

ภาพประกอบท 48 แสดงประสทธภาพของ Multi-class and OC-SVM ทใหประสทธภาพทดขนลงในภาพกลม known class โดยมคา accuracy โดยรวมคอ 71% และหากพจารณารายละเอยดในการจ าแนกคลาสตางๆโดยอาศยคา precision, recall และ f1 รวมดวย จะสามารถสรปไดดงตอไปน

(1) ประสทธภาพการจ าแนก unknown มาจากการพจารณาคา recall ซงจะเหนวาสามารถตรวจหาภาพ unknown class ได 72% และหากพจารณาคา precision แลวสามารถสรปไดวาภาพทถกท านายเปน unknown ทงหมดมความถกตองท 92% เมอน าคา precision และ recall มาหาคาเฉลยจะไดคา f1 ท 87%

Page 77: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

62

(2) ประสทธภาพในการจ าแนก p1 พจารณาจากการทสามารถตรวจหา p1 ด 82% โดยพจารณาจากคา recall และ คา precision ท 49% แสดงใหเหนความถกตองของภาพทงหมดทถกจ าแนกเปน p1 เมอน าคา precision และ recall มาหาคาเฉลยจะไดคา f1 ท 61%

(3) ประสทธภาพในการจ าแนก p2 พจารณจากความสามารถตวรจหา p2 ได 83% โดยดจากคา recall และความถกตองของภาพทงหมดทถกจ าแนกเปน p2 พจารณาจากคา precision ท 49% เมอน าคา precision และ recall มาหาคาเฉลยจะไดคา f1 ท 61%

(4) ประสทธภาพในการจ าแนก p3 พจารณาจากคา recall ทได 84% แสดงใหเหนถงประสทธภาพในการตรวจหา p3 ไดทงหมด แตเมอพจารณาคา precession ท 100% จะเหนวาภาพทถกท านายเปน p3 จะมความถกตองท 67% เทานน เมอน าคา precision และ recall มาหาคาเฉลยจะไดคา f1 ท 75

Page 78: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

บทท 5 สรปผลการวจย อภปรายผล และขอเสนอแนะ

ผ วจยไดวดประสทธภาพของแบบจ าลองแตละอลกอรทมเพอน ามาเปรยบเทยบและสรปผล โดยสามารถแบงหวขอในการสรปผลไดดงตอไปน

1. สรปผลการวจย 2. อภปรายผลการวจย 3. ขอเสนอแนะและแนวทางการวจยในอนาคต

5.1 สรปผลการวจย งานวจยนไดมงเนนทการแกปญหาจ าแนกภาพขวดเครองดมภายใตสภาพแวดลอมแบบ open-set ทในขนตอนการทดสอบแบบจ าลองจะมภาพทอยนอกประเภททปรากฏในขนตอนการฝกฝนแบบจ าลอง ภาพขวดเครองดมคลาส p1,p2,p3 จะเปนคลาสหลกทใชในการฝกฝนแบบจ าลอง โดยมเปาหมายเพอจ าแนกภาพใด ๆออกเปนคลาส p1,p2,p3 แตหากภาพนนไมอยในคลาสใดใน p1,p2,p3 เลย กตองจ าแนกออกมาเปนคลาสทไมรจก (unknown class) โดยวธการทผวจยไดท าการทดลองและน าเสนอนนจะเปนการน าโครงขายประสาทเทยมแบบคอนโวลชน เขามาใชสรางแบบจ าลองรวมกบอลกอรทมอน ๆเพอใหแบบจ าลองนสามารถจ าแนกภาพแบบ open-set ได โดยสามารถสรปประสทธภาพทง accuracy และเวลาทใชในการสรางแบบจ าลอง รวมถงประสทธภาพในการจ าแนก unknown class ไดดงตอไปน

ตาราง 5 สรปประสทธภาพ

Approaches accuracy misclass Training time (hours)

N-Binary Classifiers 0.841 0.151 9.45 N+Unknown Class Classifiers 0.925 0.075 3.23 N+Combination 0.627 0.372 1.80 2-Layer (OC-SVM+Multi class) 0.757 0.242 1.31 2-Layer (Isolation Forest+Multi class model)

0.813 0.186 1.32

Page 79: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

64

ตาราง 6 ประสทธภาพในการจ าแนก unknown class

Approaches Unknown class precision recall F1

N-Binary Classifiers 0.998 0.793 0.934 N+Unknown Class Classifiers 0.998 0.995 0.953 N+Combination 0.766 0.695 0.774 2-Layer (OC-SVM+Multi class) 0.921 0.727 0.870 2-Layer (Isolation Forest+Multi class model)

0.885 0.852 0.888

5.2 อภปรายผลการวจย จากผลการทดลองขางตนจะเหนไดวา N+Unknown Class Classifiers ให Accuracy สงทสดท 92% และหากพจารณาเฉพาะการจ าแนกภาพทไม รจะเหนวายงสามารถจ าแนก unknown class ไดดทสดอกดวย เมอพจารณาทงคา precision, recall และ f1 N-Binary Classifiers เปนวธทใหประสทธภาพทดรองจาก N+Unknown อยางไรกตามเวลาท ใชในการฝกฝนแบบจ าลองกใชเวลาสงกวาว ธการอนมาก ๆ เนองจาก N-Binary Classifiers จะแบบจ าลองเทากบจ านวนคลาสทตองการจ าแนก จงใชเวลาสงกวาวธการอน N-Binary Classifiers จงไมเหมาะในกรณทมคลาสทตองการจ าแนกเปนจ านวนมาก N+Combination เปนวธการทใหความแมนย าดอยกวาวธการอน ๆทงหมด จากการทดลองนผวจยสามารถสรปไดวาการสราง Additional class ทมาจากการน าภาพของ p1, p2, p3 มารวมกน ไมสามารถเปน ตวแทนของ unknown class ไดด ทง 3 วธขางตนเปนเทคนคการฝกฝนแบบจ าลองโดยใชภาพจากคลาสทตองการจ าแนก รวมกบคลาสพเศษทเปนตวแทนของ unknown class ส าหรบงานวจยนกคอภาพขวดอน ๆ ทอยนอกเหนอ p1, p2, p3 ซงเทคนคลกษะนสามารถใชไดในกรณทมตวอยางของภาพทอยนอกเหนอคลาสทตองการจ าแนก 2-Layer Classification เปนวธทแตกตางกนออกไป โดยน า pre-trained model มาใชเพอสกดฟเจอรของภาพทตองการจ าแนกทง p1, p2, p3 ท าใหประหยดเวลาการฝกฝนแบบจ าลองเองตงแตตน ฟเจอรทไดจะถกใชในการสรางแบบจ าลองโดยใชอลกอรทม OC-SVM และ Isolation

Page 80: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

65

forest ซงใหผลความแมนย าคอนขางดเมอฟเจอรทใชถกลดมตของขอมลลง เมอพจารณารวมกบเวลาทใชในการฝกฝนแบบจ าลองทนอยมากแลว

5.3 ขอเสนอแนะและแนวทางการวจยในอนาคต ในการวจยครงนผวจยไดมขอเสนอแนะเพอเปนแนวทางในการพฒนาตอไปไวดงตอไปน 1. Decision function ทใชใน N-Binary Classifiers สงผลอยางมากตอการท านาย หากมการออกแบบ decision function ใหมกจะสงผลใหผลการท านายตางออกไป 2. ส าหรบงานวจยนไดสนใจเฉพาะวธการส าหรบโครงขายประสาทเทยมเทานน จงไมมการ pre-process ภาพ เชน การปรบส แสง ความคมชด ตดสญญาญรบกวนเพอใหไดขอมลทดทสดในการสรางแบบจ าลอง หากมการท า pre-process ท ดกจะสงผลใหประสทธภาพของแบบจ าลองดขนได 3. จากการทดลองทงหมด จะเหนไดวา heatmap แสดงจดส าคญททกโมเดลสกดไดทท าใหไดค าตอบทถกตองจะเปนภาพบรเวณฉลาก ดงนนหากตองการจ าแนกภาพขวดกสามารถตดมาเฉพาะบรเวณฉลากไดเลย 4. ในงานวจยชนนมการทดลองการจ าแนกแบบ 2-Layer classification ทแสดงใหเหนวาการการใช pre-trained model มาใชในการจ าแนก known และ unknown class เปนอกวธทมประสทธภาพด แตอยางไรกตาม pre-trained model ยงไมไดมการฝกฝนเพมเตม ซงหากมการท า transfer learning รวมดวย กมแนวโนมทจะไดประสทธภาพสงขน 5. ผวจยไดเผยแพรซอรสโคดผานชองทาง https://github.com/supanat/OPEN-SET-BOTTLE-CLASSIFICATION-USING-CONVOLUTION-NEURAL-NETWORK.git

Page 81: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

บรรณานกรม

บรรณานกรม

Bendale, A., & Boult, T. (2015). Towards Open Set Deep Networks. arXiv:1511.06233 [cs]. Chalapathy, R., Menon, A. K., & Chawla, S. (2018). Anomaly Detection using One-Class

Neural Networks. arXiv:1802.06360 [cs, stat]. Ge, Z., Demyanov, S., Chen, Z., & Garnavi, R. (2017). Generative OpenMax for Multi-Class

Open Set Classification. arXiv:1707.07418 [cs]. Girshick, R. (2015). Fast R-CNN. arXiv:1504.08083 [cs]. Goodfellow, I. J., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., . . .

Bengio, Y. (2014). Generative Adversarial Networks. arXiv:1406.2661 [cs, stat]. He, K., Zhang, X., Ren, S., & Sun, J. (2015). Deep Residual Learning for Image

Recognition. arXiv:1512.03385 [cs]. Huang, J., Rathod, V., Sun, C., Zhu, M., Korattikara, A., Fathi, A., . . . Murphy, K. (2016).

Speed/accuracy trade-offs for modern convolutional object detectors. arXiv:1611.10012 [cs].

Krizhevsky, A., Sutskever, I., & Hinton, G. E. (2012). ImageNet Classification with Deep Convolutional Neural Networks. In F. Pereira, C. J. C. Burges, L. Bottou, & K. Q. Weinberger (Eds.), Advances in Neural Information Processing Systems 25 (pp. 1097–1105): Curran Associates, Inc.

Lin, T.-Y., Maire, M., Belongie, S., Hays, J., Perona, P., Ramanan, D., . . . Zitnick, C. L. (2014, 2014). Microsoft COCO: Common Objects in Context.

Liu, F. T., Ting, K. M., & Zhou, Z.-H. (2008, 12/2008). Isolation Forest. Paper presented at the 2008 Eighth IEEE International Conference on Data Mining (ICDM).

Liu, F. T., Ting, K. M., & Zhou, Z. (2008, December 2008). Isolation Forest. Paper presented at the 2008 Eighth IEEE International Conference on Data Mining.

Neal, L., Olson, M., Fern, X., Wong, W.-K., & Li, F. (2018). Open Set Learning with Counterfactual Images. In V. Ferrari, M. Hebert, C. Sminchisescu, & Y. Weiss (Eds.), Computer Vision – ECCV 2018 (Vol. 11210, pp. 620-635). Cham: Springer International Publishing.

Page 82: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

67

Nguyen, A., Yosinski, J., & Clune, J. (2014). Deep Neural Networks are Easily Fooled: High Confidence Predictions for Unrecognizable Images. arXiv:1412.1897 [cs].

Oza, P., & Patel, V. M. (2019). One-Class Convolutional Neural Network. IEEE Signal Processing Letters, 26(2), 277-281. doi:10.1109/LSP.2018.2889273

Sabokrou, M., Khalooei, M., Fathy, M., & Adeli, E. (2018, 2018). Adversarially Learned One-Class Classifier for Novelty Detection. Paper presented at the Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition.

Scheirer, W. J., Rocha, A. d. R., Sapkota, A., & Boult, T. E. (2013). Toward Open Set Recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence, 35(7), 1757-1772. doi:10.1109/TPAMI.2012.256

Schölkopf, B., Williamson, R. C., Smola, A. J., Shawe-Taylor, J., & Platt, J. C. (2000). Support Vector Method for Novelty Detection. In S. A. Solla, T. K. Leen, & K. Müller (Eds.), Advances in Neural Information Processing Systems 12 (pp. 582–588): MIT Press.

Shu, L., Xu, H., & Liu, B. (2018). Unseen Class Discovery in Open-world Classification. arXiv:1801.05609 [cs].

Simonyan, K., & Zisserman, A. (2014). Very Deep Convolutional Networks for Large-Scale Image Recognition. arXiv:1409.1556 [cs].

Sricharan, K., & Srivastava, A. (2018). Building robust classifiers through generation of confident out of distribution examples. arXiv:1812.00239 [cs, stat].

Tax, D. M. J., & Duin, R. P. W. (2004). Support Vector Data Description. Machine Learning, 54(1), 45-66. doi:10.1023/B:MACH.0000008084.60811.49

Wong, S. C., Gatt, A., Stamatescu, V., & McDonnell, M. D. (2016). Understanding data augmentation for classification: when to warp? Paper presented at the 2016 international conference on digital image computing: techniques and applications (DICTA).

Page 83: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …
Page 84: OPEN-SET BOTTLE CLASSIFICATION USING CONVOLUTION …

ประวตผเขยน

ประวตผ เขยน

ชอ-สกล นายศภณฐ จนตวฒนสกล วน เดอน ป เกด 8 พฤษภาคม 2529 สถานทเกด นครศรธรรมราช