Optimasi Algoritma Klasifikasi Naive Bayes, Decision Tree, K – Nearest Neighbor, dan Random Forest menggunakan Algoritma Particle Swarm Optimization pada Diabetes Dataset
{"title":"Optimasi Algoritma Klasifikasi Naive Bayes, Decision Tree, K – Nearest Neighbor, dan Random Forest menggunakan Algoritma Particle Swarm Optimization pada Diabetes Dataset","authors":"A. Fauzi, Agus Heri Yunial","doi":"10.26418/jp.v8i3.56656","DOIUrl":null,"url":null,"abstract":"Organisasi International Diabetes Federation (IDF) mencatat pada tahun 2021 sebanyak 537 juta orang di dunia menderita penyakit diabetes dan diperkirakan jumlahnya akan mencapai 700 juta orang di tahun 2045. Dari data tersebut dapat dikatagorikan bahwa penyakit diabetes pada saat ini sudah menjadi salah satu penyakit pembunuh terbanyak didunia termasuk di Indonesia. Gejala diabetes dapat dideteksi, namun dari penelitian dalam kesehatan dasar tahun 2018, hanya seperempat dari para penderita diabetes yang mengetahui dirinya terjangkit diabetes. Dalam upaya meningkatkan pengetahuan tentang gejala diabetes perlu adanya model klasifikasi yang baik dan memiliki akurasi yang tinggi sebagai prediksi penyakit diabetes, sehingga pengidap diabetes dapat diprediksi lebih dini. Dalam penelitian ini, penulis melakukan optimasi untuk meningkatkan nilai akurasi hasil klasifikasi dataset diabetes menggunakan algoritma Particle Swarm Optimization (PSO) pada empat algoritma antara lain algoritma Naive Bayes, Decision Tree, K - Nearest Neighbor, dan Random Forest. Dari hasil penghitungan didapat nilai akurasi algoritma Naive Bayes sebelum optimasi 84.07% dan setelah optimasi 89.01%. Algoritma Decision Tree sebelum optimasi 94.78% dan setelah optimasi 96.98%. Algoritma K-Nearest Neighbor sebelum optimasi 85.99% dan setelah optimasi 94.51%. Algoritma Random Forest sebelum optimasi 97.25% dan setelah optimasi 98.35%. Berdasarkan hasil penghitungan nilai akurasi tertinggi sebelum dan sesudah optimasi adalah algoritma random forest, sedangkan kenaikan hasil optimasi tertinggi yaitu algoritma K-Nearest Neighbor sebanyak 8.52%.","PeriodicalId":31793,"journal":{"name":"JEPIN Jurnal Edukasi dan Penelitian Informatika","volume":"47 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2022-12-20","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"JEPIN Jurnal Edukasi dan Penelitian Informatika","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.26418/jp.v8i3.56656","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
Organisasi International Diabetes Federation (IDF) mencatat pada tahun 2021 sebanyak 537 juta orang di dunia menderita penyakit diabetes dan diperkirakan jumlahnya akan mencapai 700 juta orang di tahun 2045. Dari data tersebut dapat dikatagorikan bahwa penyakit diabetes pada saat ini sudah menjadi salah satu penyakit pembunuh terbanyak didunia termasuk di Indonesia. Gejala diabetes dapat dideteksi, namun dari penelitian dalam kesehatan dasar tahun 2018, hanya seperempat dari para penderita diabetes yang mengetahui dirinya terjangkit diabetes. Dalam upaya meningkatkan pengetahuan tentang gejala diabetes perlu adanya model klasifikasi yang baik dan memiliki akurasi yang tinggi sebagai prediksi penyakit diabetes, sehingga pengidap diabetes dapat diprediksi lebih dini. Dalam penelitian ini, penulis melakukan optimasi untuk meningkatkan nilai akurasi hasil klasifikasi dataset diabetes menggunakan algoritma Particle Swarm Optimization (PSO) pada empat algoritma antara lain algoritma Naive Bayes, Decision Tree, K - Nearest Neighbor, dan Random Forest. Dari hasil penghitungan didapat nilai akurasi algoritma Naive Bayes sebelum optimasi 84.07% dan setelah optimasi 89.01%. Algoritma Decision Tree sebelum optimasi 94.78% dan setelah optimasi 96.98%. Algoritma K-Nearest Neighbor sebelum optimasi 85.99% dan setelah optimasi 94.51%. Algoritma Random Forest sebelum optimasi 97.25% dan setelah optimasi 98.35%. Berdasarkan hasil penghitungan nilai akurasi tertinggi sebelum dan sesudah optimasi adalah algoritma random forest, sedangkan kenaikan hasil optimasi tertinggi yaitu algoritma K-Nearest Neighbor sebanyak 8.52%.