Penerapan Metode Support Vector Machine Dalam Klasifikasi Bunga Iris

A. Desiani, Irmeilyana Irmeilyana, H. Hanum, Y. Andriani, Sri Indra Maiyanti, Clarita Margo Uteh, Ira Rayyani
{"title":"Penerapan Metode Support Vector Machine Dalam Klasifikasi Bunga Iris","authors":"A. Desiani, Irmeilyana Irmeilyana, H. Hanum, Y. Andriani, Sri Indra Maiyanti, Clarita Margo Uteh, Ira Rayyani","doi":"10.20961/ijai.v7i1.61486","DOIUrl":null,"url":null,"abstract":"Abstrak Data mining adalah proses melatih komputer untuk mengenali suatu pola menggunakan teknik statistika mapun matematika. Salah satu teknik data mining yang sering digunakan adalah klasifikasi, yakni mengelompokkan data ke dalam suatu label menggunakan atribut. Pada klasifikasi, Support Vector Machine (SVM) merupakan salah satu metode yang paling banyak digunakan. Penelitian ini akan memanfaatkan metode SVM dalam melakukan klasifikasi bunga Iris. Data yang diteliti menggunakan sebanyak 150 data dengan menggunakan dua metode data latih, yakni percentage split dan k-fold cross validation. Data diolah melalui tahap pre-processing, lalu diklasifikasi menggunakan metode SVM melalui 2 metode data latih, percentage split sebesar 80% dan k-fold corss validation dengan k=10, perhitungan hasil prediksi menggunakan confusion matrix. Pada metode percentage split diperoleh nilai akurasi sebesar 96,7%, presisi 97,6%, recall sebesar 95,3%, dan F1-score sebesar 96,3%. Pada metode k-fold cross validation diperoleh nilai akurasi sebesar 92,6%, presisi 92,6%, recall sebesar 92,6%, dan F1-score sebesar 92,3%. Dengan demikian metode SVM menggunakan kernel polynomial dengan metode data latih percentage split dapat diimplementasikan ke dalam sistem klasifikasi bunga Iris.AbstractData mining is the process of training a computer to recognize a pattern using statistical and mathematical techniques. One of the data mining techniques that are often used is classification, which is to group data into the label using attributes. In classification, the Support Vector Machine (SVM) is one of the most widely used methods. This research will utilize the SVM method in classifying Iris flowers. The data studied used 150 data using two training data methods, percentage split and k-fold cross validation. The data is processed through the pre-processing stage, then classified using the SVM method through 2 training data methods, percentage split of 80% and k-fold cross validation with k = 10, and calculation of prediction results using a confusion matrix. In the percentage split method, the accuracy is 96.7%, precision is 97.6%, recall is 95.3%, and F1-score is 96.3%. In the k-fold cross validation method, the accuracy is 92.6%, precision is 92.6%, recall is 92.6%, and F1-score is 92.3%. So that the SVM method using a polynomial kernel with the percentage split training data method can be implemented into the iris classification system.","PeriodicalId":385923,"journal":{"name":"Indonesian Journal of Applied Informatics","volume":"16 4","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-04-09","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Indonesian Journal of Applied Informatics","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.20961/ijai.v7i1.61486","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Abstrak Data mining adalah proses melatih komputer untuk mengenali suatu pola menggunakan teknik statistika mapun matematika. Salah satu teknik data mining yang sering digunakan adalah klasifikasi, yakni mengelompokkan data ke dalam suatu label menggunakan atribut. Pada klasifikasi, Support Vector Machine (SVM) merupakan salah satu metode yang paling banyak digunakan. Penelitian ini akan memanfaatkan metode SVM dalam melakukan klasifikasi bunga Iris. Data yang diteliti menggunakan sebanyak 150 data dengan menggunakan dua metode data latih, yakni percentage split dan k-fold cross validation. Data diolah melalui tahap pre-processing, lalu diklasifikasi menggunakan metode SVM melalui 2 metode data latih, percentage split sebesar 80% dan k-fold corss validation dengan k=10, perhitungan hasil prediksi menggunakan confusion matrix. Pada metode percentage split diperoleh nilai akurasi sebesar 96,7%, presisi 97,6%, recall sebesar 95,3%, dan F1-score sebesar 96,3%. Pada metode k-fold cross validation diperoleh nilai akurasi sebesar 92,6%, presisi 92,6%, recall sebesar 92,6%, dan F1-score sebesar 92,3%. Dengan demikian metode SVM menggunakan kernel polynomial dengan metode data latih percentage split dapat diimplementasikan ke dalam sistem klasifikasi bunga Iris.AbstractData mining is the process of training a computer to recognize a pattern using statistical and mathematical techniques. One of the data mining techniques that are often used is classification, which is to group data into the label using attributes. In classification, the Support Vector Machine (SVM) is one of the most widely used methods. This research will utilize the SVM method in classifying Iris flowers. The data studied used 150 data using two training data methods, percentage split and k-fold cross validation. The data is processed through the pre-processing stage, then classified using the SVM method through 2 training data methods, percentage split of 80% and k-fold cross validation with k = 10, and calculation of prediction results using a confusion matrix. In the percentage split method, the accuracy is 96.7%, precision is 97.6%, recall is 95.3%, and F1-score is 96.3%. In the k-fold cross validation method, the accuracy is 92.6%, precision is 92.6%, recall is 92.6%, and F1-score is 92.3%. So that the SVM method using a polynomial kernel with the percentage split training data method can be implemented into the iris classification system.
在虹膜分类中使用支持机方法
抽象数据挖掘是一种利用数学统计技术识别模式的训练过程。最常用的数据挖掘技术之一是分类,即用属性将数据分组成标签。在分类中,支持向量机(SVM)是最常用的方法之一。本研究将利用SVM方法对虹膜进行分类。研究数据使用了多达150个数据,使用两种训练数据方法,即分割和k-fold交叉验证。数据通过预处理阶段进行处理,然后通过两种培训数据方法对SVM方法进行分类,分片分割为80%,k=10,用矩阵混和进行计算预测。在分离法中,准确性为96.7%,精度为97.6%,回报率为95.3%,f1分数为96.3%。k-折叠交叉法的准确性为92.6%,精度为92.6%,回溯为92.6%,F1-score为92.3%。因此,SVM方法使用polynomial内核和数据分析方法分割可以实现为虹膜分类系统。摘要数据挖掘是在培训一台计算机来识别统计技术和数学技术的模式的过程中。数据挖掘技术中使用的一种是机密技术,这是将数据组合到标签中使用的attributes。在分类中,支撑向量机(SVM)是最顽固的方法之一。这个研究将在classifying flowers中施放SVM的方法。数据挖掘使用了150个数据使用两种培训方法,二分分和k折交叉验证。数据通过前处理阶段,然后分类使用2种研究数据的SVM方法,用k = 10的交叉验证80%和k-fold交叉验证的二分之一,以及用混乱矩阵计算预习结果。准确准确是96.7%,准确是93.6%,计算是95。3%,f1分数是96.3%。在k-折叠的方法中,准确是92.6%,精确是92.6%,记忆是92.6%,f1 -分数是92.3%。因此,SVM方法使用了一种多面内核,其中分阶段的数据培训方法可以应用到iris classification系统中。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信