{"title":"机器学习模型对预测选择考生的准确性比较","authors":"Oktavianus Yopi Wardana, M. Ayub, Andreas Widjaja","doi":"10.28932/jutisi.v9i1.6126","DOIUrl":null,"url":null,"abstract":"Seleksi Nasional Masuk Perguruan Tinggi Negeri (SNMPTN) masih menjadi salah satu jalur favorit bagi siswa SMA untuk melanjutkan pendidikan di Perguruan Tinggi Negeri (PTN). SNMPTN menggunakan nilai rapor semester 1 sampai dengan 5 untuk 6 mata pelajaran yang diinput di Pangkalan Data Sekolah dan Siswa (PDSS). Prediksi SNMPTN dapat dilakukan menggunakan model pembelajaran mesin dengan berbagai macam metode. Penelitian ini bertujuan untuk membuat model prediksi dengan menggunakan metode Decision Tree CART, Gaussian Naïve Bayes dan Logistic Regression, melakukan prediksi dan membandingkan tingkat akurasi dari model yang dibuat. Metodologi yang digunakan dalam penelitian ini adalah Knowledge Discovery in Database (KDD). Ini untuk mendapatkan pengetahuan yang berguna dari data. Dataset yang digunakan merupakan data nilai 6 mata pelajaran selama 5 semester dari angkatan 2015 hingga 2022. Evaluasi model menggunakan Split Percentage Method dan K-Fold Cross Validation. Hasil menunjukkan, skor akurasi untuk 3 model yang dibuat berbeda. Logistic Regression memiliki skor 0,82, diikuti oleh Decision Tree CART dengan skor 0,75 dan terakhir adalah Gaussian Naïve Bayes dengan skor 0,70. Hipotesis yang diajukan oleh peneliti sesuai dengan hasil yang didapatkan, bahwa model Logistic Regression memiliki skor akurasi lebih tinggi. Secara matematis, Logistic Regression tidak terlalu rumit jika dibandingkan dengan model lainnya. Untuk mendapatkan model yang sesuai dengan kebutuhan harus melibatkan iterasi melalui proses machine learning dan mencoba berbagai macam variasi.","PeriodicalId":185279,"journal":{"name":"Jurnal Teknik Informatika dan Sistem Informasi","volume":"5 10 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-04-05","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Perbandingan Akurasi Model Pembelajaran Mesin untuk Prediksi Seleksi Masuk Perguruan Tinggi Negeri\",\"authors\":\"Oktavianus Yopi Wardana, M. Ayub, Andreas Widjaja\",\"doi\":\"10.28932/jutisi.v9i1.6126\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Seleksi Nasional Masuk Perguruan Tinggi Negeri (SNMPTN) masih menjadi salah satu jalur favorit bagi siswa SMA untuk melanjutkan pendidikan di Perguruan Tinggi Negeri (PTN). SNMPTN menggunakan nilai rapor semester 1 sampai dengan 5 untuk 6 mata pelajaran yang diinput di Pangkalan Data Sekolah dan Siswa (PDSS). Prediksi SNMPTN dapat dilakukan menggunakan model pembelajaran mesin dengan berbagai macam metode. Penelitian ini bertujuan untuk membuat model prediksi dengan menggunakan metode Decision Tree CART, Gaussian Naïve Bayes dan Logistic Regression, melakukan prediksi dan membandingkan tingkat akurasi dari model yang dibuat. Metodologi yang digunakan dalam penelitian ini adalah Knowledge Discovery in Database (KDD). Ini untuk mendapatkan pengetahuan yang berguna dari data. Dataset yang digunakan merupakan data nilai 6 mata pelajaran selama 5 semester dari angkatan 2015 hingga 2022. Evaluasi model menggunakan Split Percentage Method dan K-Fold Cross Validation. Hasil menunjukkan, skor akurasi untuk 3 model yang dibuat berbeda. Logistic Regression memiliki skor 0,82, diikuti oleh Decision Tree CART dengan skor 0,75 dan terakhir adalah Gaussian Naïve Bayes dengan skor 0,70. Hipotesis yang diajukan oleh peneliti sesuai dengan hasil yang didapatkan, bahwa model Logistic Regression memiliki skor akurasi lebih tinggi. Secara matematis, Logistic Regression tidak terlalu rumit jika dibandingkan dengan model lainnya. Untuk mendapatkan model yang sesuai dengan kebutuhan harus melibatkan iterasi melalui proses machine learning dan mencoba berbagai macam variasi.\",\"PeriodicalId\":185279,\"journal\":{\"name\":\"Jurnal Teknik Informatika dan Sistem Informasi\",\"volume\":\"5 10 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2023-04-05\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Jurnal Teknik Informatika dan Sistem Informasi\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.28932/jutisi.v9i1.6126\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Jurnal Teknik Informatika dan Sistem Informasi","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.28932/jutisi.v9i1.6126","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
摘要
国民大学入学选拔仍然是高中生在公立大学继续接受教育的首选途径之一。SNMPTN使用了学校和学生数据库中提交的6门课程的1到5门成绩单。SNMPTN预测可以使用不同方法的机器学习模型来实现。本研究的目标是使用“树车”的确定模型,Gaussian Naive Bayes和逻辑回归方法进行预测,并比较模型的准确性。用于这项研究的方法是数据库中的知识发现。这将从数据中获得有用的知识。使用的数据显示,从2015届到2022年的5个学期中,有6门课程的成绩。模型评估使用了分离式方法和K-Fold交叉验证。结果显示,这三种型号的准确率是不同的。合乎逻辑的回归分数为0.82,然后是树车的Decision Tree CART,分数为0.75,最后是Gaussian Naive Bayes,分数为0.70。研究人员提出的假设与所获得的结果相一致,即回归逻辑模型的准确率更高。从数学上讲,回归逻辑并不比其他模型复杂。为了获得满足需求的模型,必须包括通过机器学习过程进行重复,尝试各种各样的变化。
Perbandingan Akurasi Model Pembelajaran Mesin untuk Prediksi Seleksi Masuk Perguruan Tinggi Negeri
Seleksi Nasional Masuk Perguruan Tinggi Negeri (SNMPTN) masih menjadi salah satu jalur favorit bagi siswa SMA untuk melanjutkan pendidikan di Perguruan Tinggi Negeri (PTN). SNMPTN menggunakan nilai rapor semester 1 sampai dengan 5 untuk 6 mata pelajaran yang diinput di Pangkalan Data Sekolah dan Siswa (PDSS). Prediksi SNMPTN dapat dilakukan menggunakan model pembelajaran mesin dengan berbagai macam metode. Penelitian ini bertujuan untuk membuat model prediksi dengan menggunakan metode Decision Tree CART, Gaussian Naïve Bayes dan Logistic Regression, melakukan prediksi dan membandingkan tingkat akurasi dari model yang dibuat. Metodologi yang digunakan dalam penelitian ini adalah Knowledge Discovery in Database (KDD). Ini untuk mendapatkan pengetahuan yang berguna dari data. Dataset yang digunakan merupakan data nilai 6 mata pelajaran selama 5 semester dari angkatan 2015 hingga 2022. Evaluasi model menggunakan Split Percentage Method dan K-Fold Cross Validation. Hasil menunjukkan, skor akurasi untuk 3 model yang dibuat berbeda. Logistic Regression memiliki skor 0,82, diikuti oleh Decision Tree CART dengan skor 0,75 dan terakhir adalah Gaussian Naïve Bayes dengan skor 0,70. Hipotesis yang diajukan oleh peneliti sesuai dengan hasil yang didapatkan, bahwa model Logistic Regression memiliki skor akurasi lebih tinggi. Secara matematis, Logistic Regression tidak terlalu rumit jika dibandingkan dengan model lainnya. Untuk mendapatkan model yang sesuai dengan kebutuhan harus melibatkan iterasi melalui proses machine learning dan mencoba berbagai macam variasi.