Procedimentos para construção do Corpus da Computação da Língua Inglesa (CoCLI) e cálculo do esforço na construção manual de corpora / Procedures for Corpus of Computing in English (CoCLI) construction and effort calculation in manual construction of corpora

IF 0.2 0 LANGUAGE & LINGUISTICS
F. P. Oliveira
{"title":"Procedimentos para construção do Corpus da Computação da Língua Inglesa (CoCLI) e cálculo do esforço na construção manual de corpora / Procedures for Corpus of Computing in English (CoCLI) construction and effort calculation in manual construction of corpora","authors":"F. P. Oliveira","doi":"10.17851/2237-2083.29.2.909-958","DOIUrl":null,"url":null,"abstract":"Resumo: O presente trabalho tem como objetivo descrever os procedimentos metodologicos da pesquisa intitulada “ ToGatherUp : um prototipo de ferramenta para a construcao de corpora” que verificou o efeito da incorporacao da ferramenta ToGatherUp no tempo e no esforco necessarios para a construcao manual de um corpus que elaboramos: o Corpus da Computacao da Lingua Inglesa (CoCLI). Para tanto, discorremos sobre como os autores da pesquisa desenvolveram um conjunto de metricas de medicao de esforco – Esforco da Atividade (EA), Esforco Total de Coleta do Texto (ETCT) e Esforco Total do Projeto (ETP) – que serviram de base para a realizacao de um experimento estatistico comparativo entre os projetos de elaboracao manual de duas versoes identicas do CoCLI que se diferenciam por em um deles utilizar o ToGatherUp e o outro nao. O resultado do experimento demonstrou uma reducao media de 7,47% no ETP do projeto em que o ToGatherUp foi incorporado em relacao ao ETP do projeto em que a ferramenta nao foi utilizada, o que corroborou a hipotese de que ela reduz o tempo e o esforco despendidos pelo pesquisador em projetos de elaboracao manual de corpora . Palavras-chave: Linguistica de Corpus ; construcao manual de corpus ; metricas de medicao de esforco; ToGatherUp. Abstract: The present work aims to describe the methodological procedures of the research entitled “ ToGatherUp : a prototype of a tool for corpora construction” that verified the effect of incorporating ToGatherUp in necessary time and effort invested in manual construction of Corpus of Computing in English (CoCLI). To this end, we discuss how the research authors developed a set of metrics for measuring effort – Activity Effort (EA), Total Effort for Text Collection (ETCT) and Total Project Effort (ETP) – which served as the basis for conducting a comparative statistical experiment between the manual elaboration of two identical versions of the CoCLI: which differ from each other by one of them using the ToGatherUp and the other one not using it. The experiment shows an average reduction of 7.47% in the ETP when using ToGatherUp compared to the ETP when not using the tool. This result corroborates the hypothesis that the tool reduces the time and effort spent by the researcher on manual elaboration projects of corpora . Keywords: Corpus Linguistics; manual construction of corpus ; effort measurement metrics; ToGatherUp .","PeriodicalId":42188,"journal":{"name":"Revista de Estudos da Linguagem","volume":"29 1","pages":"909-958"},"PeriodicalIF":0.2000,"publicationDate":"2021-03-19","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Revista de Estudos da Linguagem","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.17851/2237-2083.29.2.909-958","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"0","JCRName":"LANGUAGE & LINGUISTICS","Score":null,"Total":0}
引用次数: 0

Abstract

Resumo: O presente trabalho tem como objetivo descrever os procedimentos metodologicos da pesquisa intitulada “ ToGatherUp : um prototipo de ferramenta para a construcao de corpora” que verificou o efeito da incorporacao da ferramenta ToGatherUp no tempo e no esforco necessarios para a construcao manual de um corpus que elaboramos: o Corpus da Computacao da Lingua Inglesa (CoCLI). Para tanto, discorremos sobre como os autores da pesquisa desenvolveram um conjunto de metricas de medicao de esforco – Esforco da Atividade (EA), Esforco Total de Coleta do Texto (ETCT) e Esforco Total do Projeto (ETP) – que serviram de base para a realizacao de um experimento estatistico comparativo entre os projetos de elaboracao manual de duas versoes identicas do CoCLI que se diferenciam por em um deles utilizar o ToGatherUp e o outro nao. O resultado do experimento demonstrou uma reducao media de 7,47% no ETP do projeto em que o ToGatherUp foi incorporado em relacao ao ETP do projeto em que a ferramenta nao foi utilizada, o que corroborou a hipotese de que ela reduz o tempo e o esforco despendidos pelo pesquisador em projetos de elaboracao manual de corpora . Palavras-chave: Linguistica de Corpus ; construcao manual de corpus ; metricas de medicao de esforco; ToGatherUp. Abstract: The present work aims to describe the methodological procedures of the research entitled “ ToGatherUp : a prototype of a tool for corpora construction” that verified the effect of incorporating ToGatherUp in necessary time and effort invested in manual construction of Corpus of Computing in English (CoCLI). To this end, we discuss how the research authors developed a set of metrics for measuring effort – Activity Effort (EA), Total Effort for Text Collection (ETCT) and Total Project Effort (ETP) – which served as the basis for conducting a comparative statistical experiment between the manual elaboration of two identical versions of the CoCLI: which differ from each other by one of them using the ToGatherUp and the other one not using it. The experiment shows an average reduction of 7.47% in the ETP when using ToGatherUp compared to the ETP when not using the tool. This result corroborates the hypothesis that the tool reduces the time and effort spent by the researcher on manual elaboration projects of corpora . Keywords: Corpus Linguistics; manual construction of corpus ; effort measurement metrics; ToGatherUp .
英语语料库计算(CoCLI)的构建程序和人工语料库构建中的工作量计算/英语语料库计算(CoCLI)的构建程序和人工语料库构建中的工作量计算
摘要:本工作旨在描述题为“ToGatherUp:语料库构建的原型工具”的研究的方法论过程,该研究验证了在手动构建语料库所需的时间和精力上结合ToGatherUp工具的效果,我们详细阐述了语料库:英语计算语料库(CoCLI)。为此,我们讨论了该研究的作者是如何制定一套运动药物的指标——活动努力(AE)的,以及总文本收集工作量(ETCT)和总项目工作量(ETP)——这是在手动阐述两个相同的CoCLI诗句的项目之间实现比较统计实验的基础,其中一个使用ToGatherUp,另一个不使用。实验结果显示,与未使用该工具的项目的ETP相比,ToGatherUp被纳入的项目的ET P平均减少了7.47%,这证实了这样一种假设,即它减少了研究人员在手动语料库设计项目中花费的时间和精力。关键词:语料库语言学;人工语料库建设;压力药物指标;ToGatherUp。摘要:本工作旨在描述题为“ToGatherUp:语料库构建工具的原型”的研究的方法论过程,该研究验证了在人工构建英语计算语料库(CoCLI)所投入的必要时间和精力中引入ToGatherUp的效果。为此,我们讨论了研究作者如何开发一套衡量努力的指标——活动努力(EA),文本收集的总工作量(ETCT)和总项目工作量(ETP)——这是在手工制作两个相同版本的CoCLI之间进行比较统计实验的基础:其中一个版本使用ToGatherUp,另一个版本不使用ToGather Up,这两个版本之间存在差异。实验显示,与不使用该工具时的ETP相比,使用ToGatherUp时ETP平均降低了7.47%。这一结果证实了这样一种假设,即该工具减少了研究人员在语料库手工精化项目上花费的时间和精力。关键词:语料库语言学;语料库的人工构建;努力测量指标;ToGatherUp。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
Revista de Estudos da Linguagem
Revista de Estudos da Linguagem LANGUAGE & LINGUISTICS-
CiteScore
0.30
自引率
0.00%
发文量
55
审稿时长
52 weeks
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信