{"title":"Decision Tree and K-Nearest Neighbor (K-NN) Algorithm Based on Particle Swarm Optimization (PSO) for Diabetes Mellitus Prediction Accuracy Analysis","authors":"A. Rachman, S. Supratman, Euis Nur Fitriani Dewi","doi":"10.24114/cess.v7i2.34245","DOIUrl":null,"url":null,"abstract":"Penyakit Diabetes Mellitus merupakan penyakit tidak menular, tetapi penyakit ini merupakan salah satu penyakit yang mematikan bagi yang mengidapnya. Penyakit ini disebabkan oleh beberapa factor diantaranya pola makan hidup yang tidak teratur atau berlebihan. Apabila penyakit ini tidak dihentikan, maka penderita penyakit Diabetes Mellitus akan semakin memakan para pasien penderita penyakit ini. Menurut WHO atau World Health Organization, sekitar 425 juta orang menderita penyakit diabetes, kemudian 1,6 juta kematian setiap tahunnya di akibatkan oleh penyakit diabetes. Kemudian, pada tahun 2016 di Indonesia, kematian yang disebabkan oleh penyakit diabetes sekitar 99 ribu jiwa. Penyakit diabetes pada tahun ke tahun semakin meningkat, jadi perlu adanya sebuah sistem yang dapat membantu medis untuk melakukan klasifikasi terhadap diabetes berdasarkan data kesehatan pasien. Salah satu metode yang dapat digunakan untuk memprediksi penyakit diabetes mellitus adalah dengan menggunakan data mining. Data mining merupakan suatu proses yang interaktif untuk memprediksi penyakit diabetes mellitus. Prediksi untuk mendiagnosis penyakit ini menggunakan seleksi fitur berbasis Particle Swarm Optimization (PSO) pada dataset Kaggle.com. Dan metode klasifikasi yang digunakan yaitu metode Decision Tree dan K-Nearest Neighbors (K-NN). Hasil dari penelitian ini menghasilkan nilai akurasi tertinggi sebanyak 79.8% dengan AUC 0.71 dengan menggunakan metode Decision Tree, dan untuk menggunakan optimasi metode K-Nearest Neighbors (K-NN) menggunakan Particle Swarm Optimization (PSO) memiliki nilai akurasi tertinggi sebanyak 77.09%.","PeriodicalId":53361,"journal":{"name":"CESS Journal of Computer Engineering System and Science","volume":null,"pages":null},"PeriodicalIF":0.0000,"publicationDate":"2022-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"CESS Journal of Computer Engineering System and Science","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.24114/cess.v7i2.34245","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
Penyakit Diabetes Mellitus merupakan penyakit tidak menular, tetapi penyakit ini merupakan salah satu penyakit yang mematikan bagi yang mengidapnya. Penyakit ini disebabkan oleh beberapa factor diantaranya pola makan hidup yang tidak teratur atau berlebihan. Apabila penyakit ini tidak dihentikan, maka penderita penyakit Diabetes Mellitus akan semakin memakan para pasien penderita penyakit ini. Menurut WHO atau World Health Organization, sekitar 425 juta orang menderita penyakit diabetes, kemudian 1,6 juta kematian setiap tahunnya di akibatkan oleh penyakit diabetes. Kemudian, pada tahun 2016 di Indonesia, kematian yang disebabkan oleh penyakit diabetes sekitar 99 ribu jiwa. Penyakit diabetes pada tahun ke tahun semakin meningkat, jadi perlu adanya sebuah sistem yang dapat membantu medis untuk melakukan klasifikasi terhadap diabetes berdasarkan data kesehatan pasien. Salah satu metode yang dapat digunakan untuk memprediksi penyakit diabetes mellitus adalah dengan menggunakan data mining. Data mining merupakan suatu proses yang interaktif untuk memprediksi penyakit diabetes mellitus. Prediksi untuk mendiagnosis penyakit ini menggunakan seleksi fitur berbasis Particle Swarm Optimization (PSO) pada dataset Kaggle.com. Dan metode klasifikasi yang digunakan yaitu metode Decision Tree dan K-Nearest Neighbors (K-NN). Hasil dari penelitian ini menghasilkan nilai akurasi tertinggi sebanyak 79.8% dengan AUC 0.71 dengan menggunakan metode Decision Tree, dan untuk menggunakan optimasi metode K-Nearest Neighbors (K-NN) menggunakan Particle Swarm Optimization (PSO) memiliki nilai akurasi tertinggi sebanyak 77.09%.