Perbandingan Akurasi Model Pembelajaran Mesin untuk Prediksi Seleksi Masuk Perguruan Tinggi Negeri

Oktavianus Yopi Wardana, M. Ayub, Andreas Widjaja
{"title":"Perbandingan Akurasi Model Pembelajaran Mesin untuk Prediksi Seleksi Masuk Perguruan Tinggi Negeri","authors":"Oktavianus Yopi Wardana, M. Ayub, Andreas Widjaja","doi":"10.28932/jutisi.v9i1.6126","DOIUrl":null,"url":null,"abstract":"Seleksi Nasional Masuk Perguruan Tinggi Negeri (SNMPTN) masih menjadi salah satu jalur favorit bagi siswa SMA untuk melanjutkan pendidikan di Perguruan Tinggi Negeri (PTN). SNMPTN menggunakan nilai rapor semester 1 sampai dengan 5 untuk 6 mata pelajaran yang diinput di Pangkalan Data Sekolah dan Siswa (PDSS). Prediksi SNMPTN dapat dilakukan menggunakan model pembelajaran mesin dengan berbagai macam metode. Penelitian ini bertujuan untuk membuat model prediksi dengan menggunakan metode Decision Tree CART, Gaussian Naïve Bayes dan Logistic Regression, melakukan prediksi dan membandingkan tingkat akurasi dari model yang dibuat. Metodologi yang digunakan dalam penelitian ini adalah Knowledge Discovery in Database (KDD). Ini untuk mendapatkan pengetahuan yang berguna dari data. Dataset yang digunakan merupakan data nilai 6 mata pelajaran selama 5 semester dari angkatan 2015 hingga 2022. Evaluasi model menggunakan Split Percentage Method dan K-Fold Cross Validation. Hasil menunjukkan, skor akurasi untuk 3 model yang dibuat berbeda. Logistic Regression memiliki skor 0,82, diikuti oleh Decision Tree CART dengan skor 0,75 dan terakhir adalah Gaussian Naïve Bayes dengan skor 0,70. Hipotesis yang diajukan oleh peneliti sesuai dengan hasil yang didapatkan, bahwa model Logistic Regression memiliki skor akurasi lebih tinggi. Secara matematis, Logistic Regression tidak terlalu rumit jika dibandingkan dengan model lainnya. Untuk mendapatkan model yang sesuai dengan kebutuhan harus melibatkan iterasi melalui proses machine learning dan mencoba berbagai macam variasi.","PeriodicalId":185279,"journal":{"name":"Jurnal Teknik Informatika dan Sistem Informasi","volume":"5 10 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-04-05","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Jurnal Teknik Informatika dan Sistem Informasi","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.28932/jutisi.v9i1.6126","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Seleksi Nasional Masuk Perguruan Tinggi Negeri (SNMPTN) masih menjadi salah satu jalur favorit bagi siswa SMA untuk melanjutkan pendidikan di Perguruan Tinggi Negeri (PTN). SNMPTN menggunakan nilai rapor semester 1 sampai dengan 5 untuk 6 mata pelajaran yang diinput di Pangkalan Data Sekolah dan Siswa (PDSS). Prediksi SNMPTN dapat dilakukan menggunakan model pembelajaran mesin dengan berbagai macam metode. Penelitian ini bertujuan untuk membuat model prediksi dengan menggunakan metode Decision Tree CART, Gaussian Naïve Bayes dan Logistic Regression, melakukan prediksi dan membandingkan tingkat akurasi dari model yang dibuat. Metodologi yang digunakan dalam penelitian ini adalah Knowledge Discovery in Database (KDD). Ini untuk mendapatkan pengetahuan yang berguna dari data. Dataset yang digunakan merupakan data nilai 6 mata pelajaran selama 5 semester dari angkatan 2015 hingga 2022. Evaluasi model menggunakan Split Percentage Method dan K-Fold Cross Validation. Hasil menunjukkan, skor akurasi untuk 3 model yang dibuat berbeda. Logistic Regression memiliki skor 0,82, diikuti oleh Decision Tree CART dengan skor 0,75 dan terakhir adalah Gaussian Naïve Bayes dengan skor 0,70. Hipotesis yang diajukan oleh peneliti sesuai dengan hasil yang didapatkan, bahwa model Logistic Regression memiliki skor akurasi lebih tinggi. Secara matematis, Logistic Regression tidak terlalu rumit jika dibandingkan dengan model lainnya. Untuk mendapatkan model yang sesuai dengan kebutuhan harus melibatkan iterasi melalui proses machine learning dan mencoba berbagai macam variasi.
机器学习模型对预测选择考生的准确性比较
国民大学入学选拔仍然是高中生在公立大学继续接受教育的首选途径之一。SNMPTN使用了学校和学生数据库中提交的6门课程的1到5门成绩单。SNMPTN预测可以使用不同方法的机器学习模型来实现。本研究的目标是使用“树车”的确定模型,Gaussian Naive Bayes和逻辑回归方法进行预测,并比较模型的准确性。用于这项研究的方法是数据库中的知识发现。这将从数据中获得有用的知识。使用的数据显示,从2015届到2022年的5个学期中,有6门课程的成绩。模型评估使用了分离式方法和K-Fold交叉验证。结果显示,这三种型号的准确率是不同的。合乎逻辑的回归分数为0.82,然后是树车的Decision Tree CART,分数为0.75,最后是Gaussian Naive Bayes,分数为0.70。研究人员提出的假设与所获得的结果相一致,即回归逻辑模型的准确率更高。从数学上讲,回归逻辑并不比其他模型复杂。为了获得满足需求的模型,必须包括通过机器学习过程进行重复,尝试各种各样的变化。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:604180095
Book学术官方微信