{"title":"INVESTIGATING THE PERFORMANCE OF FEATURE ION METHODS IN CLASSIFYING STUDEN","authors":"Özlem Bezek Güre","doi":"10.35826/ijetsar.668","DOIUrl":null,"url":null,"abstract":"Bu çalıÅma, özellik seçme algoritmalarından yararlanarak EÄitimsel Veri MadenciliÄi (EDM) baÄlamında makine öÄrenimi modellerinin optimize edilmesine odaklanmaktadır. Özellik seçim yöntemleri, makine öÄrenme algoritmalarının hızını ve tahminleme performansını arttırmaya, verinin anlaÅılmasına ve maliyetinin de azaltılmasına olanak saÄlamaktadırlar Bu çalıÅmada; özellik seçim yöntemlerinden Information Gain, Gain Ratio, Symmetric Uncertainty Coefficient, Relief-F, Correlation Based Feature Selection Method ve One R measure kullanılarak, üniversite öÄrencilerinin baÅarılarını etkileyen faktörleri belirlemek amaçlanmaktadır. Özellik seçim yöntemlerinin etkisini karÅılaÅtırmak amacıyla Naïve Bayes yöntemi uygulanmıÅtır. Bu amaçla, UCI Machine Learning Repository veri tabanında yer alan “Higher Education Students Performance Evaluation dataset” kullanılmıÅtır. Veri seti, 33 deÄiÅken ve 145 örnekten oluÅmaktadır. ÇalıÅmada; 30 deÄiÅken kullanılmıÅtır. Analiz sonuçlarına göre; %57.24 ile Information Gain ve Relief-F ölçüsü en iyi özellik seçim yöntemi olarak belirlenmiÅtir. Correlation Based Feature Selection Method hariç diÄer tüm yöntemlerde öÄrenci baÅarısını etkileyen en önemli faktör, öÄrencinin son yarıyıl genel not ortalaması olarak tespit edilmiÅtir. DiÄer taraftan; One R yöntemi hariç kullanılan özellik seçim yöntemlerinin Naïve Bayes yönteminin performasını artırdıÄı görülmektedir. Özellik seçim yöntemlerinin veri madenciliÄi yöntemlerin verimliliÄini artırmak amacıyla kullanılması önerilmektedir.","PeriodicalId":262926,"journal":{"name":"International Journal of Education Technology and Scientific Researches","volume":"38 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"International Journal of Education Technology and Scientific Researches","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.35826/ijetsar.668","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
Bu çalıÅma, özellik seçme algoritmalarından yararlanarak EÄitimsel Veri MadenciliÄi (EDM) baÄlamında makine öÄrenimi modellerinin optimize edilmesine odaklanmaktadır. Özellik seçim yöntemleri, makine öÄrenme algoritmalarının hızını ve tahminleme performansını arttırmaya, verinin anlaÅılmasına ve maliyetinin de azaltılmasına olanak saÄlamaktadırlar Bu çalıÅmada; özellik seçim yöntemlerinden Information Gain, Gain Ratio, Symmetric Uncertainty Coefficient, Relief-F, Correlation Based Feature Selection Method ve One R measure kullanılarak, üniversite öÄrencilerinin baÅarılarını etkileyen faktörleri belirlemek amaçlanmaktadır. Özellik seçim yöntemlerinin etkisini karÅılaÅtırmak amacıyla Naïve Bayes yöntemi uygulanmıÅtır. Bu amaçla, UCI Machine Learning Repository veri tabanında yer alan “Higher Education Students Performance Evaluation dataset” kullanılmıÅtır. Veri seti, 33 deÄiÅken ve 145 örnekten oluÅmaktadır. ÇalıÅmada; 30 deÄiÅken kullanılmıÅtır. Analiz sonuçlarına göre; %57.24 ile Information Gain ve Relief-F ölçüsü en iyi özellik seçim yöntemi olarak belirlenmiÅtir. Correlation Based Feature Selection Method hariç diÄer tüm yöntemlerde öÄrenci baÅarısını etkileyen en önemli faktör, öÄrencinin son yarıyıl genel not ortalaması olarak tespit edilmiÅtir. DiÄer taraftan; One R yöntemi hariç kullanılan özellik seçim yöntemlerinin Naïve Bayes yönteminin performasını artırdıÄı görülmektedir. Özellik seçim yöntemlerinin veri madenciliÄi yöntemlerin verimliliÄini artırmak amacıyla kullanılması önerilmektedir.