Complexidade versus dificuldade: Uma análise da sua correlação em questões de programação em juízes on-line

Jackson Celestino Fernandes, Leandro S. G. Carvalho, David Braga Fernandes de Oliveira, Elaine H. T. Oliveira, F. Pereira, Tanara Lauschner
{"title":"Complexidade versus dificuldade: Uma análise da sua correlação em questões de programação em juízes on-line","authors":"Jackson Celestino Fernandes, Leandro S. G. Carvalho, David Braga Fernandes de Oliveira, Elaine H. T. Oliveira, F. Pereira, Tanara Lauschner","doi":"10.5753/rbie.2024.3587","DOIUrl":null,"url":null,"abstract":"Ambientes de correção automática de código são cada vez mais usados no processo de ensino-aprendizagem de disciplinas de programação. Porém, um problema frequentemente enfrentado pelos professores que usam tais ambientes é determinar a dificuldade das questões cadastradas. Este trabalho tem como objetivo realizar uma análise de correlação entre métricas de complexidade de código e a dificuldade enfrentada pelos alunos, de maneira que seja possível prever automaticamente o nível de dificuldade de uma questão apenas conhecendo seu modelo de solução. Este estudo foi dividido em três etapas: i) análise da correlação de Spearman entre métricas de complexidade (extraídas da questão) e de dificuldade (extraídas da interação do aluno com a questão); ii) predição da classe de dificuldade de questões por meio de modelos de aprendizado de máquina para classificação; e iii) predição de métricas de dificuldade usando modelos de regressão. Quanto ao item i), observou-se que 96% das correlações foram fracas ou inexistentes entre métricas individuais de complexidade de código e de dificuldade, 4% de casos de correlação moderada e nenhum caso de correlação forte. Para o item ii), o maior f1-score obtido foi de 88%, considerando classificação com dois níveis de dificuldade (“fácil” e “difícil”), e f1-score máximo de 67%, considerando classificação com três níveis (“fácil”, “médio” e “difícil”). Para o item iii), o melhor resultado obtido foi um coeficiente de determinação ajustado de 63%.","PeriodicalId":383295,"journal":{"name":"Revista Brasileira de Informática na Educação","volume":"3 6","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2024-01-16","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Revista Brasileira de Informática na Educação","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5753/rbie.2024.3587","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Ambientes de correção automática de código são cada vez mais usados no processo de ensino-aprendizagem de disciplinas de programação. Porém, um problema frequentemente enfrentado pelos professores que usam tais ambientes é determinar a dificuldade das questões cadastradas. Este trabalho tem como objetivo realizar uma análise de correlação entre métricas de complexidade de código e a dificuldade enfrentada pelos alunos, de maneira que seja possível prever automaticamente o nível de dificuldade de uma questão apenas conhecendo seu modelo de solução. Este estudo foi dividido em três etapas: i) análise da correlação de Spearman entre métricas de complexidade (extraídas da questão) e de dificuldade (extraídas da interação do aluno com a questão); ii) predição da classe de dificuldade de questões por meio de modelos de aprendizado de máquina para classificação; e iii) predição de métricas de dificuldade usando modelos de regressão. Quanto ao item i), observou-se que 96% das correlações foram fracas ou inexistentes entre métricas individuais de complexidade de código e de dificuldade, 4% de casos de correlação moderada e nenhum caso de correlação forte. Para o item ii), o maior f1-score obtido foi de 88%, considerando classificação com dois níveis de dificuldade (“fácil” e “difícil”), e f1-score máximo de 67%, considerando classificação com três níveis (“fácil”, “médio” e “difícil”). Para o item iii), o melhor resultado obtido foi um coeficiente de determinação ajustado de 63%.
复杂性与难度:在线评委编程问题中的相关性分析
在编程学科的教与学过程中,自动纠错环境的应用越来越广泛。然而,教师在使用此类环境时经常面临的一个问题是如何确定注册问题的难度。这项工作旨在分析代码复杂度指标与学生面临的难度之间的相关性,从而有可能仅通过了解问题的求解模型就能自动预测问题的难度级别。本研究分为三个阶段:i) 分析复杂度指标(从问题中提取)与难度指标(从学生与问题的互动中提取)之间的斯皮尔曼相关性;ii) 利用机器学习模型进行分类,预测问题的难度等级;iii) 利用回归模型预测难度指标。在第 i) 项中,96% 的代码复杂度和难度指标之间的相关性较弱或不存在相关性,4% 的指标之间存在中等程度的相关性,没有指标之间存在较强的相关性。对于项目 ii),考虑到两级难度分类("易 "和 "难"),最高的 f1 分数为 88%;考虑到三级难度分类("易"、"中 "和 "难"),最高的 f1 分数为 67%。至于第 iii)项,所取得的最佳结果是 63%的调整确定系数。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信