{"title":"计算技术在方言学和词典学领域的应用","authors":"Jorge Luiz Nunes dos Santos Junior","doi":"10.5433/2237-4876.2023v26n3p102-114","DOIUrl":null,"url":null,"abstract":"Esse trabalho tem como objetivo demonstrar e discutir sobre o uso da Extensible Markup Language (XML) e das expressões X-Query como técnicas computacionais utilizadas no tratamento de dados dialetais e lexicográficos permitindo, dessa forma, a execução de tarefas de Processamento de Linguagem Natural (PLN). Trata-se de um recorte da pesquisa de doutoramento que teve como objetivo, mais amplo, desenvolver um protótipo de vocabulário dialetal eletrônico a partir dos dados do Projeto Atlas Linguístico do Brasil (ALiB), referente à rede de pontos do interior da região Norte do país. Desse modo, foi possível recuperar informações específicas do banco de dados em XML para analisar questões de interesse da Dialetologia, a partir da filtragem de dados por meio das variáveis localidade, sexo e idade, bem como selecionar um conjunto de informações em formato lexicográfico para exibi-las no protótipo do vocabulário dialetal. O estudo fundamenta-se na Linguística Computacional, na Dialetologia e na Lexicografia e justifica-se pela necessidade da transformação de dados de origem oral em um formato que permita o PLN, viabilizando a recuperação eletrônica de informações para análises linguísticas, além de fornecer meios de apresentação de dados em formato digital.","PeriodicalId":515419,"journal":{"name":"Signum: Estudos da Linguagem","volume":"23 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2024-07-03","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"The use of computational techniques in the Dialectology and Lexicography field\",\"authors\":\"Jorge Luiz Nunes dos Santos Junior\",\"doi\":\"10.5433/2237-4876.2023v26n3p102-114\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Esse trabalho tem como objetivo demonstrar e discutir sobre o uso da Extensible Markup Language (XML) e das expressões X-Query como técnicas computacionais utilizadas no tratamento de dados dialetais e lexicográficos permitindo, dessa forma, a execução de tarefas de Processamento de Linguagem Natural (PLN). Trata-se de um recorte da pesquisa de doutoramento que teve como objetivo, mais amplo, desenvolver um protótipo de vocabulário dialetal eletrônico a partir dos dados do Projeto Atlas Linguístico do Brasil (ALiB), referente à rede de pontos do interior da região Norte do país. Desse modo, foi possível recuperar informações específicas do banco de dados em XML para analisar questões de interesse da Dialetologia, a partir da filtragem de dados por meio das variáveis localidade, sexo e idade, bem como selecionar um conjunto de informações em formato lexicográfico para exibi-las no protótipo do vocabulário dialetal. O estudo fundamenta-se na Linguística Computacional, na Dialetologia e na Lexicografia e justifica-se pela necessidade da transformação de dados de origem oral em um formato que permita o PLN, viabilizando a recuperação eletrônica de informações para análises linguísticas, além de fornecer meios de apresentação de dados em formato digital.\",\"PeriodicalId\":515419,\"journal\":{\"name\":\"Signum: Estudos da Linguagem\",\"volume\":\"23 1\",\"pages\":\"\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2024-07-03\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Signum: Estudos da Linguagem\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.5433/2237-4876.2023v26n3p102-114\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Signum: Estudos da Linguagem","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5433/2237-4876.2023v26n3p102-114","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
摘要
这项工作的目的是展示和讨论使用可扩展标记语言(XML)和 X-Query 表达式作为计算技术来处理方言和词典数据,从而实现自然语言处理(NLP)任务。这是一个博士研究项目的一部分,其更广泛的目标是利用巴西语言地图集项目(ALiB)的数据开发一个电子方言词汇原型。这样,就可以从 XML 数据库中检索特定信息,通过使用地域、性别和年龄等变量对数据进行过滤,以及选择一套词典格式的信息,将其显示在方言词汇原型中,从而对方言学感兴趣的问题进行分析。这项研究以计算语言学、方言学和词典学为基础,其理由是需要将口头来源的数据转换成一种允许 NLP 的格式,以便能够以电子方式检索信息进行语言分析,并提供一种以数字格式展示数据的方法。
The use of computational techniques in the Dialectology and Lexicography field
Esse trabalho tem como objetivo demonstrar e discutir sobre o uso da Extensible Markup Language (XML) e das expressões X-Query como técnicas computacionais utilizadas no tratamento de dados dialetais e lexicográficos permitindo, dessa forma, a execução de tarefas de Processamento de Linguagem Natural (PLN). Trata-se de um recorte da pesquisa de doutoramento que teve como objetivo, mais amplo, desenvolver um protótipo de vocabulário dialetal eletrônico a partir dos dados do Projeto Atlas Linguístico do Brasil (ALiB), referente à rede de pontos do interior da região Norte do país. Desse modo, foi possível recuperar informações específicas do banco de dados em XML para analisar questões de interesse da Dialetologia, a partir da filtragem de dados por meio das variáveis localidade, sexo e idade, bem como selecionar um conjunto de informações em formato lexicográfico para exibi-las no protótipo do vocabulário dialetal. O estudo fundamenta-se na Linguística Computacional, na Dialetologia e na Lexicografia e justifica-se pela necessidade da transformação de dados de origem oral em um formato que permita o PLN, viabilizando a recuperação eletrônica de informações para análises linguísticas, além de fornecer meios de apresentação de dados em formato digital.