Arif Darmawan, Muliadi Muliadi, Dwi Kartini, Triando Hamonangan Saragih, Radityo Adi Nugraha
{"title":"利用超参数调整贝叶斯搜索实现 catboost,预测糖尿病疾病","authors":"Arif Darmawan, Muliadi Muliadi, Dwi Kartini, Triando Hamonangan Saragih, Radityo Adi Nugraha","doi":"10.23960/komputasi.v11i2.13746","DOIUrl":null,"url":null,"abstract":"Diabetes merupakan masalah kesehatan masyarakat dunia dengan prevalensi yang selalu meningkat setiap tahun. Penyakit Diabetes ini perlu didiagnosis sejak dini menggunakan algoritma klasifikasi. Dataset yang digunakan yaitu PIMA Indians Diabetes Database dari Kaggle dengan 768 data dan 8 fitur. Metode pengklasifikasi yang digunakan yaitu Catboost. Klasifikasi Catboost dapat bekerja baik dalam menangani ketidak seimbangan data, namun kinerja algoritma ini masih bisa ditingkatkan lagi. Untuk mengatasi permasalahan tersebut peneliti menggunakan solusi Hyper-parameter tuning. Catboost memiliki beberapa Hyper-parameter yang dapat dikonfigurasi untuk meningkatkan kinerja dari model. Masalah mengidentifikasi nilai yang baik untuk Hyper-parameter disebut Hyper-parameter tuning. Metode Hyper-parameter tuning yang digunakan yaitu Bayesian Search yang kemudian divalidasi menggunakan 10-Fold Cross Validation sebanyak 10 iterasi. Hyper-parameter Catboost yang dikonfigurasi antara lain depth, learning_rate dan Iterations. Pengujian pada Catboost tanpa Hyper-parameter tuning memperoleh nilai presisi sebesar 0,625% dan nilai AUC sebesar 0,868%. Untuk pengujian Catboost dengan Hyper-parameter tuning memperoleh presisi sebesar 0,634 % dan AUC sebesar 0,901%. Menambahkan Hyper-parameter tuning Bayesian Search pada metode klasifikasi Catboost dapat meningkatkan hasil nilai akurasi dan nilai AUC.","PeriodicalId":292117,"journal":{"name":"Jurnal Komputasi","volume":"93 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2023-10-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"IMPLEMENTASI CATBOOST DENGAN MENGGUNAKAN HYPER-PARAMETER TUNING BAYESIAN SEARCH UNTUK MEMPREDIKSI PENYAKIT DIABETES\",\"authors\":\"Arif Darmawan, Muliadi Muliadi, Dwi Kartini, Triando Hamonangan Saragih, Radityo Adi Nugraha\",\"doi\":\"10.23960/komputasi.v11i2.13746\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Diabetes merupakan masalah kesehatan masyarakat dunia dengan prevalensi yang selalu meningkat setiap tahun. Penyakit Diabetes ini perlu didiagnosis sejak dini menggunakan algoritma klasifikasi. Dataset yang digunakan yaitu PIMA Indians Diabetes Database dari Kaggle dengan 768 data dan 8 fitur. Metode pengklasifikasi yang digunakan yaitu Catboost. Klasifikasi Catboost dapat bekerja baik dalam menangani ketidak seimbangan data, namun kinerja algoritma ini masih bisa ditingkatkan lagi. Untuk mengatasi permasalahan tersebut peneliti menggunakan solusi Hyper-parameter tuning. Catboost memiliki beberapa Hyper-parameter yang dapat dikonfigurasi untuk meningkatkan kinerja dari model. Masalah mengidentifikasi nilai yang baik untuk Hyper-parameter disebut Hyper-parameter tuning. Metode Hyper-parameter tuning yang digunakan yaitu Bayesian Search yang kemudian divalidasi menggunakan 10-Fold Cross Validation sebanyak 10 iterasi. Hyper-parameter Catboost yang dikonfigurasi antara lain depth, learning_rate dan Iterations. Pengujian pada Catboost tanpa Hyper-parameter tuning memperoleh nilai presisi sebesar 0,625% dan nilai AUC sebesar 0,868%. Untuk pengujian Catboost dengan Hyper-parameter tuning memperoleh presisi sebesar 0,634 % dan AUC sebesar 0,901%. Menambahkan Hyper-parameter tuning Bayesian Search pada metode klasifikasi Catboost dapat meningkatkan hasil nilai akurasi dan nilai AUC.\",\"PeriodicalId\":292117,\"journal\":{\"name\":\"Jurnal Komputasi\",\"volume\":\"93 1\",\"pages\":\"\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2023-10-30\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Jurnal Komputasi\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.23960/komputasi.v11i2.13746\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Jurnal Komputasi","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.23960/komputasi.v11i2.13746","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
IMPLEMENTASI CATBOOST DENGAN MENGGUNAKAN HYPER-PARAMETER TUNING BAYESIAN SEARCH UNTUK MEMPREDIKSI PENYAKIT DIABETES
Diabetes merupakan masalah kesehatan masyarakat dunia dengan prevalensi yang selalu meningkat setiap tahun. Penyakit Diabetes ini perlu didiagnosis sejak dini menggunakan algoritma klasifikasi. Dataset yang digunakan yaitu PIMA Indians Diabetes Database dari Kaggle dengan 768 data dan 8 fitur. Metode pengklasifikasi yang digunakan yaitu Catboost. Klasifikasi Catboost dapat bekerja baik dalam menangani ketidak seimbangan data, namun kinerja algoritma ini masih bisa ditingkatkan lagi. Untuk mengatasi permasalahan tersebut peneliti menggunakan solusi Hyper-parameter tuning. Catboost memiliki beberapa Hyper-parameter yang dapat dikonfigurasi untuk meningkatkan kinerja dari model. Masalah mengidentifikasi nilai yang baik untuk Hyper-parameter disebut Hyper-parameter tuning. Metode Hyper-parameter tuning yang digunakan yaitu Bayesian Search yang kemudian divalidasi menggunakan 10-Fold Cross Validation sebanyak 10 iterasi. Hyper-parameter Catboost yang dikonfigurasi antara lain depth, learning_rate dan Iterations. Pengujian pada Catboost tanpa Hyper-parameter tuning memperoleh nilai presisi sebesar 0,625% dan nilai AUC sebesar 0,868%. Untuk pengujian Catboost dengan Hyper-parameter tuning memperoleh presisi sebesar 0,634 % dan AUC sebesar 0,901%. Menambahkan Hyper-parameter tuning Bayesian Search pada metode klasifikasi Catboost dapat meningkatkan hasil nilai akurasi dan nilai AUC.