校对中的主观性通过语言偏差操作符的词汇自动检测

IF 0.3 Q4 LINGUISTICS
Linguamatica Pub Date : 2020-06-29 DOI:10.21814/lm.12.1.313
Márcia Cançado, Luana Amaral, Evelin Amorim, A. Veloso, Heliana Mello
{"title":"校对中的主观性通过语言偏差操作符的词汇自动检测","authors":"Márcia Cançado, Luana Amaral, Evelin Amorim, A. Veloso, Heliana Mello","doi":"10.21814/lm.12.1.313","DOIUrl":null,"url":null,"abstract":"EnglishEssays are very important assessment tools for Brazilian students. Therefore, it is expected that the grading of these texts will be made with as little subjectivity as possible. However, in an analysis of a sample of grading sheet comments by evaluators, we have noticed a high degree of subjectivity in these texts. From this first analysis, carried manually, we proposed the hypothesis that this genre is more subjective than one would expect. In order to corroborate this hypothesis, we have drawn up a list of linguistic bias markers, divided into four categories: argumentative operators, presupposition operators, modalization operators, and opinion and value operators. This list was applied to a corpus of essay grading sheet comments by evaluators, using an automatic language bias detection methodology. From this, we were able to quantify the linguistic bias markers present in these texts. These bias markers were also analyzed in two other corpora: abstracts and product reviews published on internet sales sites. We have compared the percentage of these markers in evaluators’ comments with the percentage numbers of these markers in genres admittedly less subjective (abstracts) and admittedly more subjective (reviews). For such comparison, we have used boxplots, a statistical tool widely used in data comparison analysis. Our results indicated that the grading sheets, as for the number of bias markers, are closer to more subjective texts than to less subjective texts. This corroborates our hypothesis and indicates that these grading sheets present a high degree of subjectivity, closer to the degree of a more subjective text. Thus, we conclude that these grading sheets reflect the personal views of the evaluator, deviating from the correction criteria, which raises doubts about considering this genre an exempt and fair assessment instrument. portuguesAs redacoes sao instrumentos avaliativos muito importantes para os estudantes brasileiros. Mesmo que seja assumido que a subjetividade esteja presente em todo e qualquer texto, espera-se que as correcoes dessas redacoes sejam feitas com o minimo de subjetividade possivel. Entretanto, a partir da analise de uma amostra de correcoes de redacao, percebemos um alto grau de subjetividade nesses textos. Baseados nessa pre-analise, feita de forma manual, levantamos a hipotese de que o genero \"correcao de redacao\" e mais subjetivo do que se esperaria. Para corroborar essa hipotese, elaboramos uma lista de operadores linguisticos, marcadores de vies, dividida em quatro categorias: operadores argumentativos, operadores de pressuposicao, operadores de modalidade e operadores de opiniao e valoracao. Essa lista foi aplicada, atraves de uma metodologia de deteccao automatica de linguagem enviesada, a um corpus de correcoes de redacao. A partir disso, quantificamos os operadores de vies presentes nesses textos. Foram tambem analisados esses operadores de vies em dois outros corpora: de resumos academicos e de resenhas de produtos publicadas em sites de vendas na internet. A ideia dessa analise foi compararmos a distribuicao dessas marcas de vies nas correcoes de redacao e em generos reconhecidamente menos subjetivos (resumos academicos) e reconhecidamente mais subjetivos (resenhas). Para tal comparacao, lancamos mao de uma ferramenta estatistica muito utilizada na analise de comparacao de dados, os boxplots. Os nossos resultados mostraram que a distribuicao de operadores de vies linguistico nas correcoes de redacao se aproxima mais da distribuicao desses itens em resenhas do que em resumos academicos. Isso corrobora nossa hipotese e indica que o grau de subjetividade das correcoes e alto, estando mais proximo do grau de subjetividade de um texto como as resenhas. Concluimos, portanto, que essas correcoes refletem pontos de vista do corretor, que se afastam dos criterios de correcao, o que coloca duvidas sobre a consideracao desse genero como um instrumento avaliador isento e justo.","PeriodicalId":41819,"journal":{"name":"Linguamatica","volume":null,"pages":null},"PeriodicalIF":0.3000,"publicationDate":"2020-06-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"3","resultStr":"{\"title\":\"Subjetividade em correções de redações detecção automática através de léxico de operadores de viés linguístico\",\"authors\":\"Márcia Cançado, Luana Amaral, Evelin Amorim, A. Veloso, Heliana Mello\",\"doi\":\"10.21814/lm.12.1.313\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"EnglishEssays are very important assessment tools for Brazilian students. Therefore, it is expected that the grading of these texts will be made with as little subjectivity as possible. However, in an analysis of a sample of grading sheet comments by evaluators, we have noticed a high degree of subjectivity in these texts. From this first analysis, carried manually, we proposed the hypothesis that this genre is more subjective than one would expect. In order to corroborate this hypothesis, we have drawn up a list of linguistic bias markers, divided into four categories: argumentative operators, presupposition operators, modalization operators, and opinion and value operators. This list was applied to a corpus of essay grading sheet comments by evaluators, using an automatic language bias detection methodology. From this, we were able to quantify the linguistic bias markers present in these texts. These bias markers were also analyzed in two other corpora: abstracts and product reviews published on internet sales sites. We have compared the percentage of these markers in evaluators’ comments with the percentage numbers of these markers in genres admittedly less subjective (abstracts) and admittedly more subjective (reviews). For such comparison, we have used boxplots, a statistical tool widely used in data comparison analysis. Our results indicated that the grading sheets, as for the number of bias markers, are closer to more subjective texts than to less subjective texts. This corroborates our hypothesis and indicates that these grading sheets present a high degree of subjectivity, closer to the degree of a more subjective text. Thus, we conclude that these grading sheets reflect the personal views of the evaluator, deviating from the correction criteria, which raises doubts about considering this genre an exempt and fair assessment instrument. portuguesAs redacoes sao instrumentos avaliativos muito importantes para os estudantes brasileiros. Mesmo que seja assumido que a subjetividade esteja presente em todo e qualquer texto, espera-se que as correcoes dessas redacoes sejam feitas com o minimo de subjetividade possivel. Entretanto, a partir da analise de uma amostra de correcoes de redacao, percebemos um alto grau de subjetividade nesses textos. Baseados nessa pre-analise, feita de forma manual, levantamos a hipotese de que o genero \\\"correcao de redacao\\\" e mais subjetivo do que se esperaria. Para corroborar essa hipotese, elaboramos uma lista de operadores linguisticos, marcadores de vies, dividida em quatro categorias: operadores argumentativos, operadores de pressuposicao, operadores de modalidade e operadores de opiniao e valoracao. Essa lista foi aplicada, atraves de uma metodologia de deteccao automatica de linguagem enviesada, a um corpus de correcoes de redacao. A partir disso, quantificamos os operadores de vies presentes nesses textos. Foram tambem analisados esses operadores de vies em dois outros corpora: de resumos academicos e de resenhas de produtos publicadas em sites de vendas na internet. A ideia dessa analise foi compararmos a distribuicao dessas marcas de vies nas correcoes de redacao e em generos reconhecidamente menos subjetivos (resumos academicos) e reconhecidamente mais subjetivos (resenhas). Para tal comparacao, lancamos mao de uma ferramenta estatistica muito utilizada na analise de comparacao de dados, os boxplots. Os nossos resultados mostraram que a distribuicao de operadores de vies linguistico nas correcoes de redacao se aproxima mais da distribuicao desses itens em resenhas do que em resumos academicos. Isso corrobora nossa hipotese e indica que o grau de subjetividade das correcoes e alto, estando mais proximo do grau de subjetividade de um texto como as resenhas. Concluimos, portanto, que essas correcoes refletem pontos de vista do corretor, que se afastam dos criterios de correcao, o que coloca duvidas sobre a consideracao desse genero como um instrumento avaliador isento e justo.\",\"PeriodicalId\":41819,\"journal\":{\"name\":\"Linguamatica\",\"volume\":null,\"pages\":null},\"PeriodicalIF\":0.3000,\"publicationDate\":\"2020-06-29\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"3\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Linguamatica\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.21814/lm.12.1.313\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"Q4\",\"JCRName\":\"LINGUISTICS\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Linguamatica","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.21814/lm.12.1.313","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q4","JCRName":"LINGUISTICS","Score":null,"Total":0}
引用次数: 3

摘要

警告律师是巴西学生非常重要的评估工具。因此,预计这些文本的评分将尽可能减少主观性。然而,在评估人员对评分表评论样本的分析中,我们注意到这些文本中存在高度的主观性。从第一次手动分析中,我们提出了这样一个假设,即这种类型比人们预期的更主观。为了证实这一假设,我们列出了一份语言偏见标记列表,分为四类:议论文运算符、假设运算符、模态运算符以及观点和价值运算符。该列表由评估人员使用自动语言偏见检测方法应用于论文评分表评论语料库。由此,我们能够量化这些文本中存在的语言偏见标记。这些偏见标记也在另外两个语料库中进行了分析:在互联网销售网站上发表的摘要和产品评论。我们将这些标记在评估者评论中的百分比与这些标记在公认不太主观(摘要)和公认更主观(评论)的流派中的百分比进行了比较。对于这种比较,我们使用了箱图,这是一种广泛用于数据比较分析的统计工具。我们的结果表明,就偏倚标记的数量而言,评分表更接近主观程度较高的文本,而不是主观程度较低的文本。这证实了我们的假设,并表明这些评分表呈现出高度的主观性,更接近于更主观的文本。因此,我们得出的结论是,这些评分表反映了评估者的个人观点,偏离了校正标准,这引发了人们对将这一类型视为一个例子和公平的评估工具的怀疑。论文对巴西学生来说是非常重要的评估工具。即使假设主体性存在于任何文本中,也应以尽可能小的主观性对这些文章进行更正。然而,通过对编辑更正样本的分析,我们发现这些文本具有高度的主观性。基于手动进行的预分析,我们假设“编辑更正”这一类型比预期的更主观。为了支持这一假设,我们详细列出了一份语言运算符,即偏误标记,分为四类:议论文运算符、预设运算符、模态运算符以及观点和评价运算符。该列表通过自动检测有偏见的语言的方法应用于编辑更正语料库。由此,我们量化了这些文本中存在的偏差算子。在另外两个语料库中也对这些偏倚算子进行了分析:学术摘要和互联网销售网站上发布的产品评论。这项分析的目的是比较这些偏差标记在编辑更正和慷慨的(公认不太主观的)学术摘要和公认更主观的(评论)中的分布。为了进行这种比较,我们推出了一种广泛用于数据比较分析的统计工具,即箱图。我们的研究结果表明,与学术摘要相比,编辑更正中语言偏见算子的分布更接近评论中这些项目的分布。这证实了我们的假设,并表明更正的主观性程度很高,更接近于评论等文本的主观性程度。因此,我们得出的结论是,这些更正反映了经纪人的观点,偏离了更正标准,这引发了人们对这类作为豁免和公平估价工具的考虑的怀疑。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
Subjetividade em correções de redações detecção automática através de léxico de operadores de viés linguístico
EnglishEssays are very important assessment tools for Brazilian students. Therefore, it is expected that the grading of these texts will be made with as little subjectivity as possible. However, in an analysis of a sample of grading sheet comments by evaluators, we have noticed a high degree of subjectivity in these texts. From this first analysis, carried manually, we proposed the hypothesis that this genre is more subjective than one would expect. In order to corroborate this hypothesis, we have drawn up a list of linguistic bias markers, divided into four categories: argumentative operators, presupposition operators, modalization operators, and opinion and value operators. This list was applied to a corpus of essay grading sheet comments by evaluators, using an automatic language bias detection methodology. From this, we were able to quantify the linguistic bias markers present in these texts. These bias markers were also analyzed in two other corpora: abstracts and product reviews published on internet sales sites. We have compared the percentage of these markers in evaluators’ comments with the percentage numbers of these markers in genres admittedly less subjective (abstracts) and admittedly more subjective (reviews). For such comparison, we have used boxplots, a statistical tool widely used in data comparison analysis. Our results indicated that the grading sheets, as for the number of bias markers, are closer to more subjective texts than to less subjective texts. This corroborates our hypothesis and indicates that these grading sheets present a high degree of subjectivity, closer to the degree of a more subjective text. Thus, we conclude that these grading sheets reflect the personal views of the evaluator, deviating from the correction criteria, which raises doubts about considering this genre an exempt and fair assessment instrument. portuguesAs redacoes sao instrumentos avaliativos muito importantes para os estudantes brasileiros. Mesmo que seja assumido que a subjetividade esteja presente em todo e qualquer texto, espera-se que as correcoes dessas redacoes sejam feitas com o minimo de subjetividade possivel. Entretanto, a partir da analise de uma amostra de correcoes de redacao, percebemos um alto grau de subjetividade nesses textos. Baseados nessa pre-analise, feita de forma manual, levantamos a hipotese de que o genero "correcao de redacao" e mais subjetivo do que se esperaria. Para corroborar essa hipotese, elaboramos uma lista de operadores linguisticos, marcadores de vies, dividida em quatro categorias: operadores argumentativos, operadores de pressuposicao, operadores de modalidade e operadores de opiniao e valoracao. Essa lista foi aplicada, atraves de uma metodologia de deteccao automatica de linguagem enviesada, a um corpus de correcoes de redacao. A partir disso, quantificamos os operadores de vies presentes nesses textos. Foram tambem analisados esses operadores de vies em dois outros corpora: de resumos academicos e de resenhas de produtos publicadas em sites de vendas na internet. A ideia dessa analise foi compararmos a distribuicao dessas marcas de vies nas correcoes de redacao e em generos reconhecidamente menos subjetivos (resumos academicos) e reconhecidamente mais subjetivos (resenhas). Para tal comparacao, lancamos mao de uma ferramenta estatistica muito utilizada na analise de comparacao de dados, os boxplots. Os nossos resultados mostraram que a distribuicao de operadores de vies linguistico nas correcoes de redacao se aproxima mais da distribuicao desses itens em resenhas do que em resumos academicos. Isso corrobora nossa hipotese e indica que o grau de subjetividade das correcoes e alto, estando mais proximo do grau de subjetividade de um texto como as resenhas. Concluimos, portanto, que essas correcoes refletem pontos de vista do corretor, que se afastam dos criterios de correcao, o que coloca duvidas sobre a consideracao desse genero como um instrumento avaliador isento e justo.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
Linguamatica
Linguamatica LINGUISTICS-
CiteScore
1.40
自引率
0.00%
发文量
4
审稿时长
6 weeks
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信