比较特征提取方法和机器学习模型在作文自动评分中的表现

Chinese/English journal of educational measurement and evaluation Pub Date : 2023-09-01 DOI:10.59863/vlgu9815

Li Yao, Hongzan Jiao

{"title":"比较特征提取方法和机器学习模型在作文自动评分中的表现","authors":"Li Yao, Hongzan Jiao","doi":"10.59863/vlgu9815","DOIUrl":null,"url":null,"abstract":"本研究利用特征提取与机器学习方法分析 Kaggle 数据，即 ASAP 数据集。具体而言，应用自然语言处理(Natural Language Processing, NLP)和双向编码表示转换模型 (Bidirectional Encoder Representations from Transformers, BERT)进行语料处理和特征提取，并涵盖不同的机器学习模型，包括传统的机器学习分类器和基于神经网络的方法。对评分系统使用有监督学习模型，对其中 6/8 的写作指令(prompt)进行单独训练或同时训练。与已有研究相比，本研究发现:(1)增加特征的数量(如使用 Spacy Textsta 的易读性得分)能够提高作文评分系统的预测能力;(2)使用 NLP 进行语料处理和特征提取的神经网络模型，同时训练所有写作指令时表现优于其他模型，整体二次加权 Kappa 系数(QWK)为 0.9724。其中，写作指令 1 的 QWK 最高，具体为 0.859，所有 6 个写作指令的平均 QWK 为 0.771。","PeriodicalId":72586,"journal":{"name":"Chinese/English journal of educational measurement and evaluation","volume":"31 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2023-09-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"比较特征提取方法和机器学习模型在作文自动评分中的表现\",\"authors\":\"Li Yao, Hongzan Jiao\",\"doi\":\"10.59863/vlgu9815\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"本研究利用特征提取与机器学习方法分析 Kaggle 数据，即 ASAP 数据集。具体而言，应用自然语言处理(Natural Language Processing, NLP)和双向编码表示转换模型 (Bidirectional Encoder Representations from Transformers, BERT)进行语料处理和特征提取，并涵盖不同的机器学习模型，包括传统的机器学习分类器和基于神经网络的方法。对评分系统使用有监督学习模型，对其中 6/8 的写作指令(prompt)进行单独训练或同时训练。与已有研究相比，本研究发现:(1)增加特征的数量(如使用 Spacy Textsta 的易读性得分)能够提高作文评分系统的预测能力;(2)使用 NLP 进行语料处理和特征提取的神经网络模型，同时训练所有写作指令时表现优于其他模型，整体二次加权 Kappa 系数(QWK)为 0.9724。其中，写作指令 1 的 QWK 最高，具体为 0.859，所有 6 个写作指令的平均 QWK 为 0.771。\",\"PeriodicalId\":72586,\"journal\":{\"name\":\"Chinese/English journal of educational measurement and evaluation\",\"volume\":\"31 1\",\"pages\":\"\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2023-09-01\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Chinese/English journal of educational measurement and evaluation\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.59863/vlgu9815\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Chinese/English journal of educational measurement and evaluation","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.59863/vlgu9815","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 0

摘要

本研究利用特征提取与机器学习方法分析 Kaggle 数据，即 ASAP 数据集。具体而言，应用自然语言处理(Natural Language Processing, NLP)和双向编码表示转换模型 (Bidirectional Encoder Representations from Transformers, BERT)进行语料处理和特征提取，并涵盖不同的机器学习模型，包括传统的机器学习分类器和基于神经网络的方法。对评分系统使用有监督学习模型，对其中 6/8 的写作指令(prompt)进行单独训练或同时训练。与已有研究相比，本研究发现:(1)增加特征的数量(如使用 Spacy Textsta 的易读性得分)能够提高作文评分系统的预测能力;(2)使用 NLP 进行语料处理和特征提取的神经网络模型，同时训练所有写作指令时表现优于其他模型，整体二次加权 Kappa 系数(QWK)为 0.9724。其中，写作指令 1 的 QWK 最高，具体为 0.859，所有 6 个写作指令的平均 QWK 为 0.771。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

查看原文本刊更多论文

比较特征提取方法和机器学习模型在作文自动评分中的表现

求助全文

通过发布文献求助，成功后即可免费获取论文全文。去求助

来源期刊

Chinese/English journal of educational measurement and evaluation

自引率

0.00%

发文量