{"title":"Individuação de autoria e identificação de estilo: análise de dados linguísticos com auxílio do R","authors":"Luis Filipe Lima e Silva, Larissa Santos Ciríaco","doi":"10.5007/1984-8412.2022.e79086","DOIUrl":null,"url":null,"abstract":"Este artigo soma-se aos trabalhos disponíveis sobre Processamento de Língua Natural ao fornecer uma demonstração de como linguagens de programação como o R (R CORE TEAM, 2020) podem ser úteis na detecção de autoria e na identificação do estilo do autor em obras literárias. Foram selecionados dois autores e duas obras de cada, a saber: The Adventures of Tom Sawyer (1876) e Adventures of Huckleberry Finn (1884), do autor Mark Twain (1835-1910), e Typee: A Peep at Polynesian Life (1846) e Omoo: A Narrative of Adventures in the South Seas (1847), do autor Herman Melville (1819-1891). Posteriormente, os dados foram analisados seguindo a mesma metodologia de Eder et al. (2016), a fim de testar a eficácia do pacote stylo e aplicar os métodos de Análise de Componentes Principais, Análise de Cluster e Árvore de Consenso. Os resultados apontaram que cada um dos métodos testados conseguiu distinguir as obras dos autores, evidenciando-se, assim, a eficácia do pacote utilizado. Além disso, realiza-se uma análise estilométrica baseada nos métodos de Zeta de Craig e Rolling Delta. Para este último, utilizaram-se obras de dois autores de língua alemã, Frank Kafka e Heinrich von Kleist. Os resultados apontaram uma semelhança estilística de von Kleist, sobretudo, na primeira obra de Kafka. Adicionalmente, o método Rolling Delta foi usado para explorar uma análise feita por Juola (2013ª, 2013b) a respeito de uma obra de J. K. Rowling escrita sob o pseudônimo de Robert Galbraith.","PeriodicalId":31408,"journal":{"name":"Forum Linguistico","volume":" ","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2022-11-23","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Forum Linguistico","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5007/1984-8412.2022.e79086","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
Este artigo soma-se aos trabalhos disponíveis sobre Processamento de Língua Natural ao fornecer uma demonstração de como linguagens de programação como o R (R CORE TEAM, 2020) podem ser úteis na detecção de autoria e na identificação do estilo do autor em obras literárias. Foram selecionados dois autores e duas obras de cada, a saber: The Adventures of Tom Sawyer (1876) e Adventures of Huckleberry Finn (1884), do autor Mark Twain (1835-1910), e Typee: A Peep at Polynesian Life (1846) e Omoo: A Narrative of Adventures in the South Seas (1847), do autor Herman Melville (1819-1891). Posteriormente, os dados foram analisados seguindo a mesma metodologia de Eder et al. (2016), a fim de testar a eficácia do pacote stylo e aplicar os métodos de Análise de Componentes Principais, Análise de Cluster e Árvore de Consenso. Os resultados apontaram que cada um dos métodos testados conseguiu distinguir as obras dos autores, evidenciando-se, assim, a eficácia do pacote utilizado. Além disso, realiza-se uma análise estilométrica baseada nos métodos de Zeta de Craig e Rolling Delta. Para este último, utilizaram-se obras de dois autores de língua alemã, Frank Kafka e Heinrich von Kleist. Os resultados apontaram uma semelhança estilística de von Kleist, sobretudo, na primeira obra de Kafka. Adicionalmente, o método Rolling Delta foi usado para explorar uma análise feita por Juola (2013ª, 2013b) a respeito de uma obra de J. K. Rowling escrita sob o pseudônimo de Robert Galbraith.