{"title":"PERBANDINGAN MODEL RANDOM FOREST DAN XGBOOST UNTUK PREDIKSI KEJAHATAN KESUSILAAN DI PROVINSI JAWA BARAT","authors":"Adlina Khairunnisa","doi":"10.26798/jiko.v7i2.799","DOIUrl":null,"url":null,"abstract":"Jumlah kejahatan di Indonesia secara umum mengalami penurunan tetapi jumlah kejahatan terhadap kesusilaan mengalami peningkatan yang signifikan pada tahun 2020. Provinsi Jawa Barat menempati posisi ketiga dengan kejadian kejahatan kesusilaan tertinggi. Analisis klasifikasi ada atau tidaknya kejahatan kesusilaan diperlukan sebagai upaya pencegahan kejahatan kesusilaan. Masalah pada analisis klasifikasi adalah ketidakseimbangan data antar kelas pada peubah respon. Metode penanganan data tidak seimbang diantaranya undersampling, oversampling, SMOTE dan model ensemble. Data yang digunakan adalah data sekunder yang bersumber dari PODES 2018. Pemodelan menggunakan metode ensemble seperti XGBoost dan random forest dengan beberapa teknik penanganan data yang tidak seimbang seperti undersampling, oversampling, dan SMOTE. Penentuan threshold optimal digunakan untuk meningkatkan kinerja model. Model terbaik untuk mengklasifikasikan kejahatan kesusilaan di desa/kelurahan Provinsi Jawa Barat adalah XGBoost dengan SMOTE. Analisis peubah","PeriodicalId":243297,"journal":{"name":"JIKO (Jurnal Informatika dan Komputer)","volume":"59 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-09-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"JIKO (Jurnal Informatika dan Komputer)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.26798/jiko.v7i2.799","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
Jumlah kejahatan di Indonesia secara umum mengalami penurunan tetapi jumlah kejahatan terhadap kesusilaan mengalami peningkatan yang signifikan pada tahun 2020. Provinsi Jawa Barat menempati posisi ketiga dengan kejadian kejahatan kesusilaan tertinggi. Analisis klasifikasi ada atau tidaknya kejahatan kesusilaan diperlukan sebagai upaya pencegahan kejahatan kesusilaan. Masalah pada analisis klasifikasi adalah ketidakseimbangan data antar kelas pada peubah respon. Metode penanganan data tidak seimbang diantaranya undersampling, oversampling, SMOTE dan model ensemble. Data yang digunakan adalah data sekunder yang bersumber dari PODES 2018. Pemodelan menggunakan metode ensemble seperti XGBoost dan random forest dengan beberapa teknik penanganan data yang tidak seimbang seperti undersampling, oversampling, dan SMOTE. Penentuan threshold optimal digunakan untuk meningkatkan kinerja model. Model terbaik untuk mengklasifikasikan kejahatan kesusilaan di desa/kelurahan Provinsi Jawa Barat adalah XGBoost dengan SMOTE. Analisis peubah