{"title":"A Study on Exploring Variables Related to Middle School Students’ Career Indecision using Penalized Regression Model","authors":"Miran Lee, Minwook Lee","doi":"10.37210/jver.2023.42.5.71","DOIUrl":null,"url":null,"abstract":"본 연구의 목적은 기계학습 기법과 대용량 자료를 활용하여 중학생의 진로미결정에 관련되는 변수들을 종합적으로 탐색하는 데 있었다. 이를 위해 기계학습 기법 중 변수 선택에 강점을 가지고 다중공선성의 문제 해결이 가능한 Elastic Net 벌점회귀모형과 대용량 자료인 KCYPS 2018 데이터를 활용하였다. 분석결과 중학생의 진로미결정 확률에 영향을 미치는 변수로 최종 선택된 변수는 총 244개 중 41개로 나타났다. 그 중 진로미결정 확률을 높이는 것으로 예측된 변수는 17개(‘아무리 공부해도 내가 지금보다 더 잘할 수는 없다고 생각할수록, 장래가 희망적이지 않은 것 같다고 생각할수록’ 등), 진로미결정 확률을 낮추는 것으로 예측된 변수는 24개(‘주말 독서 시간을 많이 가질수록, 내가 하고 있는 공부의 의미와 목적을 분명히 알수록’ 등)로 나타났다. 본 연구는 벌점회귀모형을 활용하여 200개가 넘는 변수를 한 모형에 투입하고, 중학생의 진로미결정에 영향을 미치는 변수 가운데 기존 연구에서 다루지 못했던 변수나 새로운 변수들(‘향후 목표하는 학업 수준이 높을수록, 가족이나 친구들과 함께 있는 것보다 스마트폰을 사용하고 있는 것이 더 즐거울수록 진로미결정 확률을 높이는 것’ 등)을 확인했다는 데 연구의 의의가 있다. 향후 본 연구 결과를 보완할 수 있도록 벌점회귀모형의 통계적 추론을 추가한 연구를 후속 연구로 제안하였다.The purpose of this study was to comprehensively explore variables related to middle school students’ career indecision using machine learning techniques and large-scale data. To achieve this, the Elastic Net penalized regression model, which excels in variable selection and can address multicollinearity issues, was employed along with the extensive KCYPS 2018 dataset. Among a total of 244 variables, 41 variables were ultimately selected as influencing the probability of middle school students’ career indecision. Among these, 17 variables were predicted to increase the probability of career indecision, while 24 variables were predicted to decrease it. Variables such as leisure time, academic fervor, academic fatigue, educational level, frequency of career conversations, self-esteem, depression, introverted personality, and smartphone dependence showed relevance. This study is significant in utilizing the penalized regression model to incorporate over 200 variables into one model, identifying previously unexplored or new variables related to middle school students’ career indecision. The study suggests further research involving statistical inference with the penalized regression model for subsequent analysis.","PeriodicalId":494518,"journal":{"name":"The Journal of Vocational Education Research","volume":"34 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-10-31","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"The Journal of Vocational Education Research","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.37210/jver.2023.42.5.71","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
본 연구의 목적은 기계학습 기법과 대용량 자료를 활용하여 중학생의 진로미결정에 관련되는 변수들을 종합적으로 탐색하는 데 있었다. 이를 위해 기계학습 기법 중 변수 선택에 강점을 가지고 다중공선성의 문제 해결이 가능한 Elastic Net 벌점회귀모형과 대용량 자료인 KCYPS 2018 데이터를 활용하였다. 분석결과 중학생의 진로미결정 확률에 영향을 미치는 변수로 최종 선택된 변수는 총 244개 중 41개로 나타났다. 그 중 진로미결정 확률을 높이는 것으로 예측된 변수는 17개(‘아무리 공부해도 내가 지금보다 더 잘할 수는 없다고 생각할수록, 장래가 희망적이지 않은 것 같다고 생각할수록’ 등), 진로미결정 확률을 낮추는 것으로 예측된 변수는 24개(‘주말 독서 시간을 많이 가질수록, 내가 하고 있는 공부의 의미와 목적을 분명히 알수록’ 등)로 나타났다. 본 연구는 벌점회귀모형을 활용하여 200개가 넘는 변수를 한 모형에 투입하고, 중학생의 진로미결정에 영향을 미치는 변수 가운데 기존 연구에서 다루지 못했던 변수나 새로운 변수들(‘향후 목표하는 학업 수준이 높을수록, 가족이나 친구들과 함께 있는 것보다 스마트폰을 사용하고 있는 것이 더 즐거울수록 진로미결정 확률을 높이는 것’ 등)을 확인했다는 데 연구의 의의가 있다. 향후 본 연구 결과를 보완할 수 있도록 벌점회귀모형의 통계적 추론을 추가한 연구를 후속 연구로 제안하였다.The purpose of this study was to comprehensively explore variables related to middle school students’ career indecision using machine learning techniques and large-scale data. To achieve this, the Elastic Net penalized regression model, which excels in variable selection and can address multicollinearity issues, was employed along with the extensive KCYPS 2018 dataset. Among a total of 244 variables, 41 variables were ultimately selected as influencing the probability of middle school students’ career indecision. Among these, 17 variables were predicted to increase the probability of career indecision, while 24 variables were predicted to decrease it. Variables such as leisure time, academic fervor, academic fatigue, educational level, frequency of career conversations, self-esteem, depression, introverted personality, and smartphone dependence showed relevance. This study is significant in utilizing the penalized regression model to incorporate over 200 variables into one model, identifying previously unexplored or new variables related to middle school students’ career indecision. The study suggests further research involving statistical inference with the penalized regression model for subsequent analysis.
本研究的目的是利用机器学习技法和大容量资料,综合探索与中学生前途未定相关的变数。为此,采用了机器学习方法中在变数选择方面具有优势的Elastic Net罚点回归模型和大容量资料KCYPS 2018数据。分析结果显示,作为对中学生前途未决定概率产生影响的变数,最终被选择为244个变数中的41个。其中前途미결정提高概率预测的变数有17个(“再怎么学习比我现在还不能越想越好,将来希望,不可能是越想越”等)、真露미결정降低概率的预测的变数有24个(“周末读书多的时间越充分,我正在学习的目的和意义明知越“等)出现了。本研究利用罚分回归模型,将超过200个的变数投入到一个模型中,在影响中学生前途未决定的变数中,现有研究中未涉及的变数或新变数(‘今后目标学业水平越高;与家人和朋友在一起相比,使用智能手机越开心,就越能提高未决定前途的概率”等),这一点具有研究的意义。为了进一步完善本研究结果,提出了附加罚分回归模型统计推论的研究作为后续研究。this study was to comprehensively explore variables related to middle school students ' career indecision using machine learning techniques and large-scale data。To achieve this, the Elastic Net penalized regression model, which excels in variable selection and can address multicollinearity issues, was employed along with the extensive KCYPS 2018 dataset。41 variables were ultimately selected as influencing the probability of middle school students ' career indecision。Among these, 17 variables were predicted to increase the probability of career indecision, while 24 variables were predicted to decrease it。Variables such as leisure time, academic fervor, academic fatigue, educational level, frequency of career conversations, self-esteem, depression, introverted personality,and smartphone dependence showed relevance。This study is significant in utilizing the penalized regression model to incorporate over 200 variables into one model,identifying previously unexplored or new variables related to middle school students ' career indecision。The study suggests further research involving statistical inference with The penalized regression model for subsequent analysis。