Komparasi Metode Seleksi Fitur Dalam Prediksi Keterlambatan Pembayaran Biaya Kuliah

Teknika Pub Date : 2023-03-10 DOI:10.34148/teknika.v12i1.601
Taghfirul Azhima Yoga Siswa, Renaldi Panji Wibowo
{"title":"Komparasi Metode Seleksi Fitur Dalam Prediksi Keterlambatan Pembayaran Biaya Kuliah","authors":"Taghfirul Azhima Yoga Siswa, Renaldi Panji Wibowo","doi":"10.34148/teknika.v12i1.601","DOIUrl":null,"url":null,"abstract":"Penelitian data mining pada keterlambatan pembayaran SPP telah banyak dilakukan namun mayoritas penelitian memiliki dataset yang berdimensi rendah. Hal ini dapat menjadi bahan kajian bagi para peneliti selanjutnya dikarenakan penelitian terkait dataset keterlambatan biaya SPP yang berdimensi tinggi hanya mendapatkan akurasi dibawah 60%. Ditambah lagi penelitian klasifikasi data mining yang menguji hubungan antar atribut-atribut yang digunakan pada pemodelan terhadap label data relatif masih minim. Penelitian ini bertujuan untuk menganalisis peningkatan akurasi algoritma klasifikasi yakni K-Nearest Neighbor, Naive Bayes, C4.5, Random forest, dan Logistic Regression dalam memprediksi keterlambatan biaya kuliah yang dioptimasi dengan beberapa perbandingan algoritma seleksi fitur diantaranya Mutual Information, Forward Selection, Backward, dan Recursive Elimination. Data yang digunakan adalah data pembayaran SPP mahasiswa dari tahun 2019 - 2021 dengan teknik pembagian data menggunakan metode 5-fold cross validation. Hasil dari penelitian ini ditemukan bahwa algoritma Backward Elimination memberikan peningkatan akurasi tertinggi dengan nilai rata-rata 0,52%, sedangkan algoritma klasifikasi yang memiliki akurasi tertinggi terdapat pada random forest dan C4.5 dengan nilai akurasi sebesar 62,6%, precision 65%, recall 63% dan f1-score 61%.","PeriodicalId":52620,"journal":{"name":"Teknika","volume":"45 6 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2023-03-10","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Teknika","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.34148/teknika.v12i1.601","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Penelitian data mining pada keterlambatan pembayaran SPP telah banyak dilakukan namun mayoritas penelitian memiliki dataset yang berdimensi rendah. Hal ini dapat menjadi bahan kajian bagi para peneliti selanjutnya dikarenakan penelitian terkait dataset keterlambatan biaya SPP yang berdimensi tinggi hanya mendapatkan akurasi dibawah 60%. Ditambah lagi penelitian klasifikasi data mining yang menguji hubungan antar atribut-atribut yang digunakan pada pemodelan terhadap label data relatif masih minim. Penelitian ini bertujuan untuk menganalisis peningkatan akurasi algoritma klasifikasi yakni K-Nearest Neighbor, Naive Bayes, C4.5, Random forest, dan Logistic Regression dalam memprediksi keterlambatan biaya kuliah yang dioptimasi dengan beberapa perbandingan algoritma seleksi fitur diantaranya Mutual Information, Forward Selection, Backward, dan Recursive Elimination. Data yang digunakan adalah data pembayaran SPP mahasiswa dari tahun 2019 - 2021 dengan teknik pembagian data menggunakan metode 5-fold cross validation. Hasil dari penelitian ini ditemukan bahwa algoritma Backward Elimination memberikan peningkatan akurasi tertinggi dengan nilai rata-rata 0,52%, sedangkan algoritma klasifikasi yang memiliki akurasi tertinggi terdapat pada random forest dan C4.5 dengan nilai akurasi sebesar 62,6%, precision 65%, recall 63% dan f1-score 61%.
功能选择方法对学费延迟预测的比较
对SPP延迟付款的数据挖掘研究已经进行了很多,但大多数研究都有三维数据集。这可能是进一步研究人员的研究,因为涉及数据数据的高分级成本延迟只能得到60%以下的准确性。此外,挖掘数据分类研究测试建模中使用的数据标签相对较少的属性之间的关系。本研究旨在分析K-Nearest算法的准确性增加,Naive Bayes, C4。使用的数据是2019 - 2021年学生学费的数据,使用5折交叉验证方法进行数据分配技术。这项研究发现,反扫描算法提供了平均0.52%的准确率最高的准确率,而在随机森林和C4。5的分类算法准确率最高,得分为62.6%,precision 65%, recall 63%和f1-score 61%。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
22
审稿时长
6 weeks
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:604180095
Book学术官方微信