国内外软件在检测稿件相似性和剽窃方面的效率

IF 0.2 Q4 INFORMATION SCIENCE & LIBRARY SCIENCE
Marcelo Krokoscz
{"title":"国内外软件在检测稿件相似性和剽窃方面的效率","authors":"Marcelo Krokoscz","doi":"10.19132/1808-5245284.123123","DOIUrl":null,"url":null,"abstract":"Este estudo visa identificar a eficiência de quatorze softwares de detecção de similaridades em um texto com fragmentos sobre educação financeira, encontrados em websites da internet, anais de eventos acadêmicos e revistas científicas de acesso aberto e restrito. Os fragmentos foram usados para elaborar um texto coeso, escrito em língua portuguesa, contendo reproduções textuais literais, paráfrases, com trechos traduzidos do idioma inglês, manipulados com inserção de caractere oculto e com substituição de palavras por sinônimos. Os relatórios de similaridade gerados pelos softwares foram analisados de acordo com quatro critérios: 1 identificação de fragmentos citados corretamente; 2 identificação de fragmentos plagiados; 3 identificação de textos manipulados para enganar o software; 4 identificação de fontes originais; os quais foram pontuados em uma escala de 0 a 4 pontos. Os softwares Turnitin, StrikePlagiarism, PlagScan e Plagium tiveram performance elevada e CopySpider e Plagium (complemento do Google) foram os mais ineficientes. Constatou-se que os softwares operam com eficiência variável, o que reforça a convicção de que embora sejam ferramentas úteis para a identificação de plágio, contribuem de forma limitada para aspectos como reconhecimento de reproduções textuais literais que nem sempre correspondem à fonte original. As fontes originais de textos reescritos, manipulados e traduzidos não foram encontradas por nenhum software. O estudo contribui para o aprimoramento da capacidade do usuário na escolha, uso e análise dos relatórios de similaridades gerados por softwares, cuja eficiência pode ser maior no caso da utilização de mais de um software.","PeriodicalId":43249,"journal":{"name":"Em Questao","volume":null,"pages":null},"PeriodicalIF":0.2000,"publicationDate":"2022-09-27","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Eficiência de softwares nacionais e internacionais na detecção de similaridade e de plágio em manuscrito\",\"authors\":\"Marcelo Krokoscz\",\"doi\":\"10.19132/1808-5245284.123123\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Este estudo visa identificar a eficiência de quatorze softwares de detecção de similaridades em um texto com fragmentos sobre educação financeira, encontrados em websites da internet, anais de eventos acadêmicos e revistas científicas de acesso aberto e restrito. Os fragmentos foram usados para elaborar um texto coeso, escrito em língua portuguesa, contendo reproduções textuais literais, paráfrases, com trechos traduzidos do idioma inglês, manipulados com inserção de caractere oculto e com substituição de palavras por sinônimos. Os relatórios de similaridade gerados pelos softwares foram analisados de acordo com quatro critérios: 1 identificação de fragmentos citados corretamente; 2 identificação de fragmentos plagiados; 3 identificação de textos manipulados para enganar o software; 4 identificação de fontes originais; os quais foram pontuados em uma escala de 0 a 4 pontos. Os softwares Turnitin, StrikePlagiarism, PlagScan e Plagium tiveram performance elevada e CopySpider e Plagium (complemento do Google) foram os mais ineficientes. Constatou-se que os softwares operam com eficiência variável, o que reforça a convicção de que embora sejam ferramentas úteis para a identificação de plágio, contribuem de forma limitada para aspectos como reconhecimento de reproduções textuais literais que nem sempre correspondem à fonte original. As fontes originais de textos reescritos, manipulados e traduzidos não foram encontradas por nenhum software. O estudo contribui para o aprimoramento da capacidade do usuário na escolha, uso e análise dos relatórios de similaridades gerados por softwares, cuja eficiência pode ser maior no caso da utilização de mais de um software.\",\"PeriodicalId\":43249,\"journal\":{\"name\":\"Em Questao\",\"volume\":null,\"pages\":null},\"PeriodicalIF\":0.2000,\"publicationDate\":\"2022-09-27\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Em Questao\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.19132/1808-5245284.123123\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"Q4\",\"JCRName\":\"INFORMATION SCIENCE & LIBRARY SCIENCE\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Em Questao","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.19132/1808-5245284.123123","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q4","JCRName":"INFORMATION SCIENCE & LIBRARY SCIENCE","Score":null,"Total":0}
引用次数: 0

摘要

本研究旨在识别14个相似检测软件在互联网网站、学术事件编年史和开放和限制访问的科学期刊上发现的金融教育片段文本中的效率。这些片段被用来发展一个连贯的文本,用葡萄牙语写,包括逐字复制,意译,从英语翻译的摘录,操纵插入隐藏字符和用同义词替换单词。根据4个标准对软件生成的相似度报告进行分析:1识别正确引用的片段;2识别错误引用的片段;3识别错误引用的片段2 .剽窃片段的鉴定;识别为欺骗软件而操纵的文本;4 .识别原始来源;他们的评分范围从0到4分。Turnitin、StrikePlagiarism、PlagScan和Plagium软件性能较高,CopySpider和Plagium(谷歌插件)效率最低。研究发现,软件的运行效率各不相同,这加强了这样一种信念,即尽管它们是识别剽窃的有用工具,但它们对识别并不总是与原始来源相对应的逐字复制等方面的贡献有限。任何软件都找不到重写、操纵和翻译文本的原始来源。本研究有助于提高用户选择、使用和分析软件生成的相似度报告的能力,如果使用多个软件,其效率可能会更高。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
Eficiência de softwares nacionais e internacionais na detecção de similaridade e de plágio em manuscrito
Este estudo visa identificar a eficiência de quatorze softwares de detecção de similaridades em um texto com fragmentos sobre educação financeira, encontrados em websites da internet, anais de eventos acadêmicos e revistas científicas de acesso aberto e restrito. Os fragmentos foram usados para elaborar um texto coeso, escrito em língua portuguesa, contendo reproduções textuais literais, paráfrases, com trechos traduzidos do idioma inglês, manipulados com inserção de caractere oculto e com substituição de palavras por sinônimos. Os relatórios de similaridade gerados pelos softwares foram analisados de acordo com quatro critérios: 1 identificação de fragmentos citados corretamente; 2 identificação de fragmentos plagiados; 3 identificação de textos manipulados para enganar o software; 4 identificação de fontes originais; os quais foram pontuados em uma escala de 0 a 4 pontos. Os softwares Turnitin, StrikePlagiarism, PlagScan e Plagium tiveram performance elevada e CopySpider e Plagium (complemento do Google) foram os mais ineficientes. Constatou-se que os softwares operam com eficiência variável, o que reforça a convicção de que embora sejam ferramentas úteis para a identificação de plágio, contribuem de forma limitada para aspectos como reconhecimento de reproduções textuais literais que nem sempre correspondem à fonte original. As fontes originais de textos reescritos, manipulados e traduzidos não foram encontradas por nenhum software. O estudo contribui para o aprimoramento da capacidade do usuário na escolha, uso e análise dos relatórios de similaridades gerados por softwares, cuja eficiência pode ser maior no caso da utilização de mais de um software.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
Em Questao
Em Questao INFORMATION SCIENCE & LIBRARY SCIENCE-
自引率
0.00%
发文量
71
审稿时长
25 weeks
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信