Optimasi Algoritma Klasifikasi Naive Bayes, Decision Tree, K – Nearest Neighbor, dan Random Forest menggunakan Algoritma Particle Swarm Optimization pada Diabetes Dataset

JEPIN Jurnal Edukasi dan Penelitian Informatika Pub Date : 2022-12-20 DOI:10.26418/jp.v8i3.56656

A. Fauzi, Agus Heri Yunial

{"title":"Optimasi Algoritma Klasifikasi Naive Bayes, Decision Tree, K – Nearest Neighbor, dan Random Forest menggunakan Algoritma Particle Swarm Optimization pada Diabetes Dataset","authors":"A. Fauzi, Agus Heri Yunial","doi":"10.26418/jp.v8i3.56656","DOIUrl":null,"url":null,"abstract":"Organisasi International Diabetes Federation (IDF) mencatat pada tahun 2021 sebanyak 537 juta orang di dunia menderita penyakit diabetes dan diperkirakan jumlahnya akan mencapai 700 juta orang di tahun 2045. Dari data tersebut dapat dikatagorikan bahwa penyakit diabetes pada saat ini sudah menjadi salah satu penyakit pembunuh terbanyak didunia termasuk di Indonesia. Gejala diabetes dapat dideteksi, namun dari penelitian dalam kesehatan dasar tahun 2018, hanya seperempat dari para penderita diabetes yang mengetahui dirinya terjangkit diabetes. Dalam upaya meningkatkan pengetahuan tentang gejala diabetes perlu adanya model klasifikasi yang baik dan memiliki akurasi yang tinggi sebagai prediksi penyakit diabetes, sehingga pengidap diabetes dapat diprediksi lebih dini. Dalam penelitian ini, penulis melakukan optimasi untuk meningkatkan nilai akurasi hasil klasifikasi dataset diabetes menggunakan algoritma Particle Swarm Optimization (PSO) pada empat algoritma antara lain algoritma Naive Bayes, Decision Tree, K - Nearest Neighbor, dan Random Forest. Dari hasil penghitungan didapat nilai akurasi algoritma Naive Bayes sebelum optimasi 84.07% dan setelah optimasi 89.01%. Algoritma Decision Tree sebelum optimasi 94.78% dan setelah optimasi 96.98%. Algoritma K-Nearest Neighbor sebelum optimasi 85.99% dan setelah optimasi 94.51%. Algoritma Random Forest sebelum optimasi 97.25% dan setelah optimasi 98.35%. Berdasarkan hasil penghitungan nilai akurasi tertinggi sebelum dan sesudah optimasi adalah algoritma random forest, sedangkan kenaikan hasil optimasi tertinggi yaitu algoritma K-Nearest Neighbor sebanyak 8.52%.","PeriodicalId":31793,"journal":{"name":"JEPIN Jurnal Edukasi dan Penelitian Informatika","volume":"47 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2022-12-20","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"JEPIN Jurnal Edukasi dan Penelitian Informatika","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.26418/jp.v8i3.56656","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 0

Abstract

Organisasi International Diabetes Federation (IDF) mencatat pada tahun 2021 sebanyak 537 juta orang di dunia menderita penyakit diabetes dan diperkirakan jumlahnya akan mencapai 700 juta orang di tahun 2045. Dari data tersebut dapat dikatagorikan bahwa penyakit diabetes pada saat ini sudah menjadi salah satu penyakit pembunuh terbanyak didunia termasuk di Indonesia. Gejala diabetes dapat dideteksi, namun dari penelitian dalam kesehatan dasar tahun 2018, hanya seperempat dari para penderita diabetes yang mengetahui dirinya terjangkit diabetes. Dalam upaya meningkatkan pengetahuan tentang gejala diabetes perlu adanya model klasifikasi yang baik dan memiliki akurasi yang tinggi sebagai prediksi penyakit diabetes, sehingga pengidap diabetes dapat diprediksi lebih dini. Dalam penelitian ini, penulis melakukan optimasi untuk meningkatkan nilai akurasi hasil klasifikasi dataset diabetes menggunakan algoritma Particle Swarm Optimization (PSO) pada empat algoritma antara lain algoritma Naive Bayes, Decision Tree, K - Nearest Neighbor, dan Random Forest. Dari hasil penghitungan didapat nilai akurasi algoritma Naive Bayes sebelum optimasi 84.07% dan setelah optimasi 89.01%. Algoritma Decision Tree sebelum optimasi 94.78% dan setelah optimasi 96.98%. Algoritma K-Nearest Neighbor sebelum optimasi 85.99% dan setelah optimasi 94.51%. Algoritma Random Forest sebelum optimasi 97.25% dan setelah optimasi 98.35%. Berdasarkan hasil penghitungan nilai akurasi tertinggi sebelum dan sesudah optimasi adalah algoritma random forest, sedangkan kenaikan hasil optimasi tertinggi yaitu algoritma K-Nearest Neighbor sebanyak 8.52%.

查看原文本刊更多论文

国际糖尿病联合会(IDF)在2021年记录了世界上有537万人患有糖尿病，预计到2045年将有7亿人患有糖尿病。从这些数据中可以看出，目前糖尿病已经是包括印尼在内的世界上最致命的疾病之一。糖尿病症状是可以检测到的，但从2018年的基础健康研究来看，只有四分之一的糖尿病患者发现自己患有糖尿病。为了增加对糖尿病症状的认识，需要有一个良好的分类模型和高准确性的糖尿病预测，以便糖尿病患者能够提前预测。在本研究中，作者使用一种PSO算法在Naive Bayes、Decision Tree、K - Nearest Neighbor和Random Forest等四种算法中，对糖尿病数据集分类的准确性进行了优化。计算结果为Naive Bayes算法的准确性值提供了在84.07%和89.01%优化之前。Tree Decision算法在优化前94.78%，优化后99.98%。默认的K-Nearest算法优化前为85。99%，优化后为94.51%。随机森林算法优化前是97.25%，优化后是98.35%。优化前和优后的最高准确率计算结果为随机森林算法，而最优优先值值为8.52%。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊

JEPIN Jurnal Edukasi dan Penelitian Informatika

自引率

0.00%

发文量

审稿时长

10 weeks