Uma avaliação comparativa entre métricas de erro em um curso introdutório de programação com Python

Anais do II Simpósio Brasileiro de Educação em Computação (EDUCOMP 2022) Pub Date : 2022-04-24 DOI:10.5753/educomp.2022.19197

L. G. Araujo, Roberto A. Bittencourt, C. Chavez

{"title":"Uma avaliação comparativa entre métricas de erro em um curso introdutório de programação com Python","authors":"L. G. Araujo, Roberto A. Bittencourt, C. Chavez","doi":"10.5753/educomp.2022.19197","DOIUrl":null,"url":null,"abstract":"O feedback oferecido por mensagens de erro produzidas por compiladores e interpretadores tipicamente não é suficiente para apoiar os estudantes novatos. A inserção de feedback adicional nestas mensagens, na forma de mensagens de erro melhoradas, pode ser uma solução para melhor apoiar os estudantes novatos na aprendizagem de programação. No entanto, o oferecimento deste feedback adicional necessita de avaliação acerca da sua eficácia. Para esta avaliação, diversas técnicas são utilizadas, desde abordagens manuais a automatizadas, como as métricas de erro dos estudantes. Da literatura, destacamos as métricas Error Quotient (EQ), Watwin Algorithm e Repeated Error Density (RED). Apesar da existência destas métricas, questões relacionadas à avaliação da eficácia das mensagens permanecem em aberto. Neste artigo, objetivamos comparar as métricas existentes e propor uma nova métrica com base nos achados. Para tal fim, foi ofertado um curso introdutório de Python no ambiente PEEF. Por meio dos dados obtidos no ambiente, as métricas foram mensuradas para todos os projetos. Como resultado, ratificamos a dependência de contexto das métricas EQ e Watwin, além da adequação de RED para abordagens de programação introdutória com Python. Entretanto, destacamos algumas limitações desta última e propomos uma nova métrica, RECurrent Error Density (REC), visando melhor responder ao questionamento sobre o impacto das mensagens melhoradas na aprendizagem dos estudantes novatos. Os resultados demonstram que REC consegue mensurar erros em 43,3% dos projetos dos estudantes, atribuindo avaliação a 30,9% de projetos a mais que a métrica RED. Estes resultados demonstram que o fenômeno de recorrência de erro ocorre e não é considerado adequadamente pelas métricas apresentadas.","PeriodicalId":126919,"journal":{"name":"Anais do II Simpósio Brasileiro de Educação em Computação (EDUCOMP 2022)","volume":"20 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2022-04-24","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Anais do II Simpósio Brasileiro de Educação em Computação (EDUCOMP 2022)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5753/educomp.2022.19197","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 0

Abstract

O feedback oferecido por mensagens de erro produzidas por compiladores e interpretadores tipicamente não é suficiente para apoiar os estudantes novatos. A inserção de feedback adicional nestas mensagens, na forma de mensagens de erro melhoradas, pode ser uma solução para melhor apoiar os estudantes novatos na aprendizagem de programação. No entanto, o oferecimento deste feedback adicional necessita de avaliação acerca da sua eficácia. Para esta avaliação, diversas técnicas são utilizadas, desde abordagens manuais a automatizadas, como as métricas de erro dos estudantes. Da literatura, destacamos as métricas Error Quotient (EQ), Watwin Algorithm e Repeated Error Density (RED). Apesar da existência destas métricas, questões relacionadas à avaliação da eficácia das mensagens permanecem em aberto. Neste artigo, objetivamos comparar as métricas existentes e propor uma nova métrica com base nos achados. Para tal fim, foi ofertado um curso introdutório de Python no ambiente PEEF. Por meio dos dados obtidos no ambiente, as métricas foram mensuradas para todos os projetos. Como resultado, ratificamos a dependência de contexto das métricas EQ e Watwin, além da adequação de RED para abordagens de programação introdutória com Python. Entretanto, destacamos algumas limitações desta última e propomos uma nova métrica, RECurrent Error Density (REC), visando melhor responder ao questionamento sobre o impacto das mensagens melhoradas na aprendizagem dos estudantes novatos. Os resultados demonstram que REC consegue mensurar erros em 43,3% dos projetos dos estudantes, atribuindo avaliação a 30,9% de projetos a mais que a métrica RED. Estes resultados demonstram que o fenômeno de recorrência de erro ocorre e não é considerado adequadamente pelas métricas apresentadas.

查看原文本刊更多论文

Python编程入门课程中错误指标的比较评估

编译器和解释器产生的错误消息提供的反馈通常不足以支持新手学生。在这些消息中插入额外的反馈，以增强错误消息的形式，可以更好地支持新手学习编程。然而，提供这种额外的反馈需要对其有效性进行评估。对于这种评估，使用了几种技术，从手动到自动化的方法，如学生的错误度量。在文献中，我们强调了误差商(EQ)、Watwin算法和重复误差密度(RED)指标。尽管存在这些指标，但与评估消息有效性相关的问题仍然是开放的。在本文中，我们的目标是比较现有的指标，并基于这些发现提出一个新的指标。为此，在PEEF环境中提供了Python入门课程。通过在环境中获得的数据，对所有项目的指标进行了度量。因此，我们确认了EQ和Watwin指标的上下文依赖关系，以及RED对Python入门编程方法的适用性。然而，我们强调了后者的一些局限性，并提出了一个新的度量，递归误差密度(REC)，以更好地回答关于改进的信息对新学生学习的影响的问题。结果表明，REC可以测量43.3%的学生项目的错误，比RED指标多30.9%的项目进行评估。这些结果表明，错误复发现象的发生，并没有充分考虑所提出的指标。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊

Anais do II Simpósio Brasileiro de Educação em Computação (EDUCOMP 2022)

自引率

0.00%

发文量