{"title":"介绍法医语言学学科领域的作者归因研究和ALTXA文本分析程序","authors":"J. L. Latorre García","doi":"10.5944/rhd.vol.6.2021.30949","DOIUrl":null,"url":null,"abstract":"RESUMEN\nEste artículo presenta un caso de atribución de autoría en el ámbito de la lingüística forense a partir de la herramienta ALTXA. Primeramente, se aportará una definición general de la lingüística forense y una breve explicación de sus principales áreas de estudio con el propósito de acotar progresivamente el foco de la investigación hasta llegar a los estudios de atribución de autoría, los cuales serán abordados con mayor profundidad. En segundo lugar, el artículo evaluará las principales herramientas computacionales empleadas para determinar de forma cuantitativa la autoría de textos anónimos o disputados y presentará el software ALTXA, el cual ha sido creado por el presente grupo investigador. Dicha herramienta computacional pretende aunar las funcionalidades de distintos programas informáticos en una interfaz accesible que permita la implementación de los estudios de atribución de autoría en contextos educativos y facilite la labor del lingüista forense. El artículo concluirá con una demostración práctica de ALTXA en la que se realizará un estudio de atribución de autoría de un fragmento indubitado de William Shakespeare para demostrar la validez del programa, así como de los estudios de n-grams, una de las funcionalidades que ofrece dicha herramienta y que constituyen un procedimiento metodológico consolidado en el campo de la lingüística forense.\nPALABRAS CLAVE \nLingüística forense, lingüística computacional, atribución de autoría, William Shakespeare, n-grams.\nABSTRACT\n\nThis article will present a case of authorship attribution within the framework of forensic linguistics with the computational tool ALTXA. For such end, a general definition of forensic linguistics and an explanation of its main areas of study will be offered with the aim of narrowing down progressively the scope of the article until authorship attribution studies are presented and discussed in more depth. Afterwards, a review of the main computational tools with which the authorship of disputed or anonymous texts are analysed will be provided, and ALTXA, a software that has been developed by the researcher, will be presented. Such tool combines many of the functionalities offered by other programs in an intuitive interface that allows for the implementation of authorship attribution studies in educational settings and facilitates the labour of the forensic linguist. Lastly, the article will provide a practical demonstration of ALTXA in which the authorship of an undisputed text written by William Shakespeare will be analysed to prove its reliability. Such analysis will consist of an n-gram study, which is one of the functionalities of ALTXA and constitutes a solid methodological procedure within the framework of forensic linguistics.\nKEYWORDS\nForensic linguistics, computational linguistics, authorship attribution, William Shakespeare, n-grams.\n\n","PeriodicalId":362365,"journal":{"name":"Revista de Humanidades Digitales","volume":"14 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2021-11-26","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Una introducción a los estudios de atribución de autoría en el ámbito disciplinario de la Lingüística Forense y al programa de análisis de textos ALTXA\",\"authors\":\"J. L. Latorre García\",\"doi\":\"10.5944/rhd.vol.6.2021.30949\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"RESUMEN\\nEste artículo presenta un caso de atribución de autoría en el ámbito de la lingüística forense a partir de la herramienta ALTXA. Primeramente, se aportará una definición general de la lingüística forense y una breve explicación de sus principales áreas de estudio con el propósito de acotar progresivamente el foco de la investigación hasta llegar a los estudios de atribución de autoría, los cuales serán abordados con mayor profundidad. En segundo lugar, el artículo evaluará las principales herramientas computacionales empleadas para determinar de forma cuantitativa la autoría de textos anónimos o disputados y presentará el software ALTXA, el cual ha sido creado por el presente grupo investigador. Dicha herramienta computacional pretende aunar las funcionalidades de distintos programas informáticos en una interfaz accesible que permita la implementación de los estudios de atribución de autoría en contextos educativos y facilite la labor del lingüista forense. El artículo concluirá con una demostración práctica de ALTXA en la que se realizará un estudio de atribución de autoría de un fragmento indubitado de William Shakespeare para demostrar la validez del programa, así como de los estudios de n-grams, una de las funcionalidades que ofrece dicha herramienta y que constituyen un procedimiento metodológico consolidado en el campo de la lingüística forense.\\nPALABRAS CLAVE \\nLingüística forense, lingüística computacional, atribución de autoría, William Shakespeare, n-grams.\\nABSTRACT\\n\\nThis article will present a case of authorship attribution within the framework of forensic linguistics with the computational tool ALTXA. For such end, a general definition of forensic linguistics and an explanation of its main areas of study will be offered with the aim of narrowing down progressively the scope of the article until authorship attribution studies are presented and discussed in more depth. Afterwards, a review of the main computational tools with which the authorship of disputed or anonymous texts are analysed will be provided, and ALTXA, a software that has been developed by the researcher, will be presented. Such tool combines many of the functionalities offered by other programs in an intuitive interface that allows for the implementation of authorship attribution studies in educational settings and facilitates the labour of the forensic linguist. Lastly, the article will provide a practical demonstration of ALTXA in which the authorship of an undisputed text written by William Shakespeare will be analysed to prove its reliability. Such analysis will consist of an n-gram study, which is one of the functionalities of ALTXA and constitutes a solid methodological procedure within the framework of forensic linguistics.\\nKEYWORDS\\nForensic linguistics, computational linguistics, authorship attribution, William Shakespeare, n-grams.\\n\\n\",\"PeriodicalId\":362365,\"journal\":{\"name\":\"Revista de Humanidades Digitales\",\"volume\":\"14 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2021-11-26\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Revista de Humanidades Digitales\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.5944/rhd.vol.6.2021.30949\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Revista de Humanidades Digitales","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5944/rhd.vol.6.2021.30949","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
摘要
本文提出了一个基于ALTXA工具的法医语言学领域的作者归属案例。首先,我们将给出法医语言学的一般定义,并简要解释其主要研究领域,目的是逐步缩小研究的重点,直到作者归因研究,这将是更深入的讨论。其次,本文将评估用于定量确定匿名或有争议文本作者身份的主要计算工具,并将介绍由本研究小组创建的ALTXA软件。该计算工具旨在将不同计算机程序的功能结合在一个可访问的界面中,允许在教育环境中实现作者归因研究,并促进法医语言学家的工作。文章将演示ALTXA做法将归属研究的作者威廉·莎士比亚一定片段为证明方案的有效性,以及研究n-grams,该工具提供的功能和综合方法,构成程序的取证lingüística领域。法医语言学,计算语言学,作者归属,威廉·莎士比亚,n克。这篇文章将介绍一个使用ALTXA计算工具的法医学语言学框架内的作者归因案例。因此,将提供法医语言学的一般定义及其主要研究领域的解释,目的是逐步缩小文章的范围,直到作者归属研究得到提出和更深入的讨论。随后,将对分析有争议或匿名文本的作者身份的主要计算工具进行回顾,并介绍研究人员开发的ALTXA软件。这类工具将其他方案提供的许多功能结合在一个直观的界面中,允许在教育环境中实施作者归因研究,并促进法医语言学家的工作。Lastly,条还将提供实用demonstration of ALTXA in which the authorship of an undisputed text)的威廉·莎士比亚将analysed to prove及其可靠性。这种分析将包括六年of an n-gram study, which is one of the functionalities ALTXA和构成solid方法程序within the framework of forensic拉脱维亚。KEYWORDSForensic拉脱维亚,computational biology)拉脱维亚,authorship attribution,威廉·莎士比亚,n-grams。
Una introducción a los estudios de atribución de autoría en el ámbito disciplinario de la Lingüística Forense y al programa de análisis de textos ALTXA
RESUMEN
Este artículo presenta un caso de atribución de autoría en el ámbito de la lingüística forense a partir de la herramienta ALTXA. Primeramente, se aportará una definición general de la lingüística forense y una breve explicación de sus principales áreas de estudio con el propósito de acotar progresivamente el foco de la investigación hasta llegar a los estudios de atribución de autoría, los cuales serán abordados con mayor profundidad. En segundo lugar, el artículo evaluará las principales herramientas computacionales empleadas para determinar de forma cuantitativa la autoría de textos anónimos o disputados y presentará el software ALTXA, el cual ha sido creado por el presente grupo investigador. Dicha herramienta computacional pretende aunar las funcionalidades de distintos programas informáticos en una interfaz accesible que permita la implementación de los estudios de atribución de autoría en contextos educativos y facilite la labor del lingüista forense. El artículo concluirá con una demostración práctica de ALTXA en la que se realizará un estudio de atribución de autoría de un fragmento indubitado de William Shakespeare para demostrar la validez del programa, así como de los estudios de n-grams, una de las funcionalidades que ofrece dicha herramienta y que constituyen un procedimiento metodológico consolidado en el campo de la lingüística forense.
PALABRAS CLAVE
Lingüística forense, lingüística computacional, atribución de autoría, William Shakespeare, n-grams.
ABSTRACT
This article will present a case of authorship attribution within the framework of forensic linguistics with the computational tool ALTXA. For such end, a general definition of forensic linguistics and an explanation of its main areas of study will be offered with the aim of narrowing down progressively the scope of the article until authorship attribution studies are presented and discussed in more depth. Afterwards, a review of the main computational tools with which the authorship of disputed or anonymous texts are analysed will be provided, and ALTXA, a software that has been developed by the researcher, will be presented. Such tool combines many of the functionalities offered by other programs in an intuitive interface that allows for the implementation of authorship attribution studies in educational settings and facilitates the labour of the forensic linguist. Lastly, the article will provide a practical demonstration of ALTXA in which the authorship of an undisputed text written by William Shakespeare will be analysed to prove its reliability. Such analysis will consist of an n-gram study, which is one of the functionalities of ALTXA and constitutes a solid methodological procedure within the framework of forensic linguistics.
KEYWORDS
Forensic linguistics, computational linguistics, authorship attribution, William Shakespeare, n-grams.