Preprocessing Data dan Klasifikasi untuk Prediksi Kinerja Akademik Siswa

Takhamo Gori
{"title":"Preprocessing Data dan Klasifikasi untuk Prediksi Kinerja Akademik Siswa","authors":"Takhamo Gori","doi":"10.25126/jtiik.20241118074","DOIUrl":null,"url":null,"abstract":"Pendidikan merupakan aspek penting dalam kehidupan masyarakat dan memiliki peran yang sangat vital untuk menciptakan sumber daya manusia yang handal dan berkualitas dalam menghadapi berbagai tantangan pada era modernisasi. Namun, putus sekolah dan retensi siswa menjadi tantangan serius bagi perkembangan pendidikan saat ini. Salah satu faktor pemicu putus sekolah adalah kinerja akademik siswa yang rendah, mendorong perlunya tindakan pencegahan yang efektif untuk mengurangi tingkat kegagalan pendidikan. Penelitian ini bertujuan untuk memprediksi kinerja akademik siswa dengan mengintegrasikan metode Correlation-Based Feature Selection (CFS) dan Algoritma Naïve Nayes pada gabungan dataset pelajaran Matematika dan Bahasa Portugis dua sekolah menengah di Portugal. Proses preprocessing data melibatkan integrasi data, pelabelan data, transformasi data, dan pembersihan data diterapkan pada tahap awal penelitian. Hasil penelitian menunjukkan bahwa atribut signifikan yang mempengaruhi kinerja akademik siswa meliputi G2, G1, Higher, Medu, Studytime, goout, Absences, dan Failures. Melalui pemodelan algoritma Naïve Bayes, metode CFS terbukti meningkatkan nilai accuracy, recall, precision, dan f1-score dalam memprediksi kinerja akademik siswa. Sebelum CFS, model Naïve Bayes menunjukkan accuracy sebesar 89.27%, dengan recall, precision, danf1-score masing-masing sebesar 89.27%, 89.86%, dan 89.47%. Setelah implementasi CFS, evaluasi model prediksi mengalami peningkatan signifikan menjadi 91.22%, 91.22%, 92.24%, dan 91.48%.","PeriodicalId":32501,"journal":{"name":"Jurnal Teknologi Informasi dan Ilmu Komputer","volume":"6 19","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2024-02-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Jurnal Teknologi Informasi dan Ilmu Komputer","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.25126/jtiik.20241118074","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Pendidikan merupakan aspek penting dalam kehidupan masyarakat dan memiliki peran yang sangat vital untuk menciptakan sumber daya manusia yang handal dan berkualitas dalam menghadapi berbagai tantangan pada era modernisasi. Namun, putus sekolah dan retensi siswa menjadi tantangan serius bagi perkembangan pendidikan saat ini. Salah satu faktor pemicu putus sekolah adalah kinerja akademik siswa yang rendah, mendorong perlunya tindakan pencegahan yang efektif untuk mengurangi tingkat kegagalan pendidikan. Penelitian ini bertujuan untuk memprediksi kinerja akademik siswa dengan mengintegrasikan metode Correlation-Based Feature Selection (CFS) dan Algoritma Naïve Nayes pada gabungan dataset pelajaran Matematika dan Bahasa Portugis dua sekolah menengah di Portugal. Proses preprocessing data melibatkan integrasi data, pelabelan data, transformasi data, dan pembersihan data diterapkan pada tahap awal penelitian. Hasil penelitian menunjukkan bahwa atribut signifikan yang mempengaruhi kinerja akademik siswa meliputi G2, G1, Higher, Medu, Studytime, goout, Absences, dan Failures. Melalui pemodelan algoritma Naïve Bayes, metode CFS terbukti meningkatkan nilai accuracy, recall, precision, dan f1-score dalam memprediksi kinerja akademik siswa. Sebelum CFS, model Naïve Bayes menunjukkan accuracy sebesar 89.27%, dengan recall, precision, danf1-score masing-masing sebesar 89.27%, 89.86%, dan 89.47%. Setelah implementasi CFS, evaluasi model prediksi mengalami peningkatan signifikan menjadi 91.22%, 91.22%, 92.24%, dan 91.48%.
学生学业成绩预测的数据预处理和分类
教育是人们生活的一个重要方面,在培养可靠、合格的人力资源以应对现代化挑战方面发挥着至关重要的作用。然而,学生辍学和留级是当今教育发展面临的严峻挑战。辍学的诱因之一是学生的学业成绩不佳,因此需要采取有效的预防措施来降低教育失败率。本研究旨在通过在葡萄牙两所中学的数学和葡萄牙语综合数据集上整合基于相关性的特征选择(CFS)方法和奈耶-奈耶算法,预测学生的学业成绩。研究初期采用了数据预处理流程,包括数据整合、数据标注、数据转换和数据清理。结果显示,影响学生学业成绩的重要属性包括 G2、G1、Higher、Medu、Studytime、goout、Absences 和 Failures。通过奈伊夫贝叶斯算法建模,证明 CFS 方法提高了预测学生学业成绩的准确度、召回率、精确度和 f1 分数值。在使用 CFS 之前,Naïve Bayes 模型的准确率为 89.27%,召回率、精确率和 f1 分数分别为 89.27%、89.86% 和 89.47%。实施 CFS 后,预测模型的评估结果大幅提高,分别为 91.22%、91.22%、92.24% 和 91.48%。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
0
审稿时长
16 weeks
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信