Optimasi Algoritma Klasifikasi Naive Bayes, Decision Tree, K – Nearest Neighbor, dan Random Forest menggunakan Algoritma Particle Swarm Optimization pada Diabetes Dataset

A. Fauzi, Agus Heri Yunial
{"title":"Optimasi Algoritma Klasifikasi Naive Bayes, Decision Tree, K – Nearest Neighbor, dan Random Forest menggunakan Algoritma Particle Swarm Optimization pada Diabetes Dataset","authors":"A. Fauzi, Agus Heri Yunial","doi":"10.26418/jp.v8i3.56656","DOIUrl":null,"url":null,"abstract":"Organisasi International Diabetes Federation (IDF) mencatat pada tahun 2021 sebanyak 537 juta orang di dunia menderita penyakit diabetes dan diperkirakan jumlahnya akan mencapai 700 juta orang di tahun 2045. Dari data tersebut  dapat dikatagorikan bahwa penyakit diabetes pada saat ini sudah menjadi salah satu penyakit pembunuh terbanyak didunia termasuk di Indonesia. Gejala diabetes dapat dideteksi, namun dari penelitian dalam kesehatan dasar tahun 2018, hanya seperempat dari para penderita diabetes yang mengetahui dirinya terjangkit diabetes. Dalam upaya meningkatkan pengetahuan tentang gejala diabetes perlu adanya model klasifikasi yang baik dan memiliki akurasi yang tinggi sebagai prediksi penyakit diabetes, sehingga pengidap diabetes dapat diprediksi lebih dini. Dalam penelitian ini, penulis melakukan optimasi untuk meningkatkan nilai akurasi hasil klasifikasi dataset diabetes menggunakan algoritma Particle Swarm Optimization (PSO) pada empat algoritma antara lain algoritma Naive Bayes, Decision Tree, K - Nearest Neighbor, dan Random Forest. Dari hasil penghitungan didapat nilai akurasi algoritma Naive Bayes sebelum optimasi 84.07% dan setelah optimasi 89.01%. Algoritma Decision Tree sebelum optimasi 94.78% dan setelah optimasi 96.98%. Algoritma K-Nearest Neighbor sebelum optimasi 85.99% dan setelah optimasi 94.51%. Algoritma Random Forest sebelum optimasi 97.25% dan setelah optimasi 98.35%. Berdasarkan hasil penghitungan nilai akurasi tertinggi sebelum dan sesudah optimasi adalah algoritma random forest, sedangkan kenaikan hasil optimasi tertinggi yaitu algoritma K-Nearest Neighbor sebanyak 8.52%.","PeriodicalId":31793,"journal":{"name":"JEPIN Jurnal Edukasi dan Penelitian Informatika","volume":"47 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2022-12-20","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"JEPIN Jurnal Edukasi dan Penelitian Informatika","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.26418/jp.v8i3.56656","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Organisasi International Diabetes Federation (IDF) mencatat pada tahun 2021 sebanyak 537 juta orang di dunia menderita penyakit diabetes dan diperkirakan jumlahnya akan mencapai 700 juta orang di tahun 2045. Dari data tersebut  dapat dikatagorikan bahwa penyakit diabetes pada saat ini sudah menjadi salah satu penyakit pembunuh terbanyak didunia termasuk di Indonesia. Gejala diabetes dapat dideteksi, namun dari penelitian dalam kesehatan dasar tahun 2018, hanya seperempat dari para penderita diabetes yang mengetahui dirinya terjangkit diabetes. Dalam upaya meningkatkan pengetahuan tentang gejala diabetes perlu adanya model klasifikasi yang baik dan memiliki akurasi yang tinggi sebagai prediksi penyakit diabetes, sehingga pengidap diabetes dapat diprediksi lebih dini. Dalam penelitian ini, penulis melakukan optimasi untuk meningkatkan nilai akurasi hasil klasifikasi dataset diabetes menggunakan algoritma Particle Swarm Optimization (PSO) pada empat algoritma antara lain algoritma Naive Bayes, Decision Tree, K - Nearest Neighbor, dan Random Forest. Dari hasil penghitungan didapat nilai akurasi algoritma Naive Bayes sebelum optimasi 84.07% dan setelah optimasi 89.01%. Algoritma Decision Tree sebelum optimasi 94.78% dan setelah optimasi 96.98%. Algoritma K-Nearest Neighbor sebelum optimasi 85.99% dan setelah optimasi 94.51%. Algoritma Random Forest sebelum optimasi 97.25% dan setelah optimasi 98.35%. Berdasarkan hasil penghitungan nilai akurasi tertinggi sebelum dan sesudah optimasi adalah algoritma random forest, sedangkan kenaikan hasil optimasi tertinggi yaitu algoritma K-Nearest Neighbor sebanyak 8.52%.
国际糖尿病联合会(IDF)在2021年记录了世界上有537万人患有糖尿病,预计到2045年将有7亿人患有糖尿病。从这些数据中可以看出,目前糖尿病已经是包括印尼在内的世界上最致命的疾病之一。糖尿病症状是可以检测到的,但从2018年的基础健康研究来看,只有四分之一的糖尿病患者发现自己患有糖尿病。为了增加对糖尿病症状的认识,需要有一个良好的分类模型和高准确性的糖尿病预测,以便糖尿病患者能够提前预测。在本研究中,作者使用一种PSO算法在Naive Bayes、Decision Tree、K - Nearest Neighbor和Random Forest等四种算法中,对糖尿病数据集分类的准确性进行了优化。计算结果为Naive Bayes算法的准确性值提供了在84.07%和89.01%优化之前。Tree Decision算法在优化前94.78%,优化后99.98%。默认的K-Nearest算法优化前为85。99%,优化后为94.51%。随机森林算法优化前是97.25%,优化后是98.35%。优化前和优后的最高准确率计算结果为随机森林算法,而最优优先值值为8.52%。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
1
审稿时长
10 weeks
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信