Complexidade versus dificuldade: Uma análise da sua correlação em questões de programação em juízes on-line

Revista Brasileira de Informática na Educação Pub Date : 2024-01-16 DOI:10.5753/rbie.2024.3587

Jackson Celestino Fernandes, Leandro S. G. Carvalho, David Braga Fernandes de Oliveira, Elaine H. T. Oliveira, F. Pereira, Tanara Lauschner

{"title":"Complexidade versus dificuldade: Uma análise da sua correlação em questões de programação em juízes on-line","authors":"Jackson Celestino Fernandes, Leandro S. G. Carvalho, David Braga Fernandes de Oliveira, Elaine H. T. Oliveira, F. Pereira, Tanara Lauschner","doi":"10.5753/rbie.2024.3587","DOIUrl":null,"url":null,"abstract":"Ambientes de correção automática de código são cada vez mais usados no processo de ensino-aprendizagem de disciplinas de programação. Porém, um problema frequentemente enfrentado pelos professores que usam tais ambientes é determinar a dificuldade das questões cadastradas. Este trabalho tem como objetivo realizar uma análise de correlação entre métricas de complexidade de código e a dificuldade enfrentada pelos alunos, de maneira que seja possível prever automaticamente o nível de dificuldade de uma questão apenas conhecendo seu modelo de solução. Este estudo foi dividido em três etapas: i) análise da correlação de Spearman entre métricas de complexidade (extraídas da questão) e de dificuldade (extraídas da interação do aluno com a questão); ii) predição da classe de dificuldade de questões por meio de modelos de aprendizado de máquina para classificação; e iii) predição de métricas de dificuldade usando modelos de regressão. Quanto ao item i), observou-se que 96% das correlações foram fracas ou inexistentes entre métricas individuais de complexidade de código e de dificuldade, 4% de casos de correlação moderada e nenhum caso de correlação forte. Para o item ii), o maior f1-score obtido foi de 88%, considerando classificação com dois níveis de dificuldade (“fácil” e “difícil”), e f1-score máximo de 67%, considerando classificação com três níveis (“fácil”, “médio” e “difícil”). Para o item iii), o melhor resultado obtido foi um coeficiente de determinação ajustado de 63%.","PeriodicalId":383295,"journal":{"name":"Revista Brasileira de Informática na Educação","volume":"3 6","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2024-01-16","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Revista Brasileira de Informática na Educação","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5753/rbie.2024.3587","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 0

Abstract

Ambientes de correção automática de código são cada vez mais usados no processo de ensino-aprendizagem de disciplinas de programação. Porém, um problema frequentemente enfrentado pelos professores que usam tais ambientes é determinar a dificuldade das questões cadastradas. Este trabalho tem como objetivo realizar uma análise de correlação entre métricas de complexidade de código e a dificuldade enfrentada pelos alunos, de maneira que seja possível prever automaticamente o nível de dificuldade de uma questão apenas conhecendo seu modelo de solução. Este estudo foi dividido em três etapas: i) análise da correlação de Spearman entre métricas de complexidade (extraídas da questão) e de dificuldade (extraídas da interação do aluno com a questão); ii) predição da classe de dificuldade de questões por meio de modelos de aprendizado de máquina para classificação; e iii) predição de métricas de dificuldade usando modelos de regressão. Quanto ao item i), observou-se que 96% das correlações foram fracas ou inexistentes entre métricas individuais de complexidade de código e de dificuldade, 4% de casos de correlação moderada e nenhum caso de correlação forte. Para o item ii), o maior f1-score obtido foi de 88%, considerando classificação com dois níveis de dificuldade (“fácil” e “difícil”), e f1-score máximo de 67%, considerando classificação com três níveis (“fácil”, “médio” e “difícil”). Para o item iii), o melhor resultado obtido foi um coeficiente de determinação ajustado de 63%.

查看原文本刊更多论文

复杂性与难度：在线评委编程问题中的相关性分析

在编程学科的教与学过程中，自动纠错环境的应用越来越广泛。然而，教师在使用此类环境时经常面临的一个问题是如何确定注册问题的难度。这项工作旨在分析代码复杂度指标与学生面临的难度之间的相关性，从而有可能仅通过了解问题的求解模型就能自动预测问题的难度级别。本研究分为三个阶段：i) 分析复杂度指标（从问题中提取）与难度指标（从学生与问题的互动中提取）之间的斯皮尔曼相关性；ii) 利用机器学习模型进行分类，预测问题的难度等级；iii) 利用回归模型预测难度指标。在第 i) 项中，96% 的代码复杂度和难度指标之间的相关性较弱或不存在相关性，4% 的指标之间存在中等程度的相关性，没有指标之间存在较强的相关性。对于项目 ii)，考虑到两级难度分类（"易 "和 "难"），最高的 f1 分数为 88%；考虑到三级难度分类（"易"、"中 "和 "难"），最高的 f1 分数为 67%。至于第 iii)项，所取得的最佳结果是 63%的调整确定系数。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊

Revista Brasileira de Informática na Educação

自引率

0.00%

发文量