利用机器学习技术预测巴西东南部地区计算机工程专业学生的毕业时间

Revista Brasileira de Computação Aplicada Pub Date : 2024-05-01 DOI:10.5335/rbca.v16i1.14456

Bruno Da Silva Macedo, Camila Martins Saporetti

{"title":"利用机器学习技术预测巴西东南部地区计算机工程专业学生的毕业时间","authors":"Bruno Da Silva Macedo, Camila Martins Saporetti","doi":"10.5335/rbca.v16i1.14456","DOIUrl":null,"url":null,"abstract":"O Exame Nacional de Desempenho de Estudantes (ENADE) foi criado para avaliar o rendimento dos estudantes nos cursos das instituições superiores. Através do desempenho dos estudantes estima a qualidade dos cursos. O abandono ou atraso do curso acarreta uma ruim gestão universitária, já que o orçamento que as graduações recebem tem como fator o número de alunos formandos. Analisar dados do ENADE pode gerar insights sobre o tempo que os discentes permanecem na graduação. Como os dados do ENADE contém um número elevado de informações realizar análises visualmente é algo inviável. Para contornar essa situação, técnicas de aprendizado de máquina podem ser utilizadas com intuito de automatizar essa tarefa e apresentar os resultados. Nesse contexto, o objetivo deste trabalho é determinar, através da base do ENADE 2019, o tempo de permanência dos estudantes na graduação, tendo em vista os cursos de Engenharia da Computação na região Sudeste do Brasil. A metodologia envole o pré-processamento, a seleção de características, balanceamento dos dados, abordagem de seleção de parâmetros Grid-Search, validação cruzada e classificação. Os resultados mostram que o Random Forest teve bom desempenho nos experimentos realizados e que a aplicação do SMOTE para balanceamento dos dados se faz necessária.","PeriodicalId":138408,"journal":{"name":"Revista Brasileira de Computação Aplicada","volume":"1 S1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2024-05-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Uso de técnicas de aprendizado de máquina para predição do tempo de graduação dos discentes de Engenharia da Computação na região Sudeste do Brasil\",\"authors\":\"Bruno Da Silva Macedo, Camila Martins Saporetti\",\"doi\":\"10.5335/rbca.v16i1.14456\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"O Exame Nacional de Desempenho de Estudantes (ENADE) foi criado para avaliar o rendimento dos estudantes nos cursos das instituições superiores. Através do desempenho dos estudantes estima a qualidade dos cursos. O abandono ou atraso do curso acarreta uma ruim gestão universitária, já que o orçamento que as graduações recebem tem como fator o número de alunos formandos. Analisar dados do ENADE pode gerar insights sobre o tempo que os discentes permanecem na graduação. Como os dados do ENADE contém um número elevado de informações realizar análises visualmente é algo inviável. Para contornar essa situação, técnicas de aprendizado de máquina podem ser utilizadas com intuito de automatizar essa tarefa e apresentar os resultados. Nesse contexto, o objetivo deste trabalho é determinar, através da base do ENADE 2019, o tempo de permanência dos estudantes na graduação, tendo em vista os cursos de Engenharia da Computação na região Sudeste do Brasil. A metodologia envole o pré-processamento, a seleção de características, balanceamento dos dados, abordagem de seleção de parâmetros Grid-Search, validação cruzada e classificação. Os resultados mostram que o Random Forest teve bom desempenho nos experimentos realizados e que a aplicação do SMOTE para balanceamento dos dados se faz necessária.\",\"PeriodicalId\":138408,\"journal\":{\"name\":\"Revista Brasileira de Computação Aplicada\",\"volume\":\"1 S1\",\"pages\":\"\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2024-05-01\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Revista Brasileira de Computação Aplicada\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.5335/rbca.v16i1.14456\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Revista Brasileira de Computação Aplicada","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5335/rbca.v16i1.14456","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 0

摘要

全国学生成绩考试（ENADE）旨在评估学生在高等教育课程中的表现。学生成绩用于评估课程质量。退学或延迟课程会导致大学管理不善，因为本科课程获得的预算是以毕业学生人数为基础的。通过分析ENADE 数据，我们可以深入了解学生攻读学位的时间。由于ENADE数据包含大量信息，对其进行可视化分析并不可行。为了解决这个问题，可以使用机器学习技术来自动完成这项任务并展示结果。在这种情况下，这项工作的目的是利用ENADE 2019数据库确定学生在本科课程中的学习时间，同时考虑到巴西东南部地区的计算机工程课程。该方法包括预处理、特征选择、数据平衡、网格搜索参数选择方法、交叉验证和分类。结果表明，随机森林在实验中表现良好，有必要应用 SMOTE 进行数据平衡。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

查看原文本刊更多论文

Uso de técnicas de aprendizado de máquina para predição do tempo de graduação dos discentes de Engenharia da Computação na região Sudeste do Brasil

O Exame Nacional de Desempenho de Estudantes (ENADE) foi criado para avaliar o rendimento dos estudantes nos cursos das instituições superiores. Através do desempenho dos estudantes estima a qualidade dos cursos. O abandono ou atraso do curso acarreta uma ruim gestão universitária, já que o orçamento que as graduações recebem tem como fator o número de alunos formandos. Analisar dados do ENADE pode gerar insights sobre o tempo que os discentes permanecem na graduação. Como os dados do ENADE contém um número elevado de informações realizar análises visualmente é algo inviável. Para contornar essa situação, técnicas de aprendizado de máquina podem ser utilizadas com intuito de automatizar essa tarefa e apresentar os resultados. Nesse contexto, o objetivo deste trabalho é determinar, através da base do ENADE 2019, o tempo de permanência dos estudantes na graduação, tendo em vista os cursos de Engenharia da Computação na região Sudeste do Brasil. A metodologia envole o pré-processamento, a seleção de características, balanceamento dos dados, abordagem de seleção de parâmetros Grid-Search, validação cruzada e classificação. Os resultados mostram que o Random Forest teve bom desempenho nos experimentos realizados e que a aplicação do SMOTE para balanceamento dos dados se faz necessária.

求助全文

通过发布文献求助，成功后即可免费获取论文全文。去求助

来源期刊

Revista Brasileira de Computação Aplicada

自引率

0.00%

发文量