XPTA:基于跨语言方法的葡萄牙语AMR解析器

IF 0.1 Q4 LINGUISTICS

Linguamatica Pub Date : 2022-07-02 DOI:10.21814/lm.14.1.359

E. Seno, Helena de Medeiros Caseli, M. Inácio, Rafael Torres Anchiêta, Renata Ramisch

{"title":"XPTA:基于跨语言方法的葡萄牙语AMR解析器","authors":"E. Seno, Helena de Medeiros Caseli, M. Inácio, Rafael Torres Anchiêta, Renata Ramisch","doi":"10.21814/lm.14.1.359","DOIUrl":null,"url":null,"abstract":"O crescente interesse pelo processamento semântico automático, especialmente por parte dos pesquisadores de Compreensão e de Geração de Língua Natural, tem levado a muitas pesquisas relacionadas ao desenvolvimento de parsers semânticos. E, nesse contexto, a AMR (Abstract Meaning Representation) é um dos formalismos de representação semântica que tem recebido mais atenção recentemente, devido à sua maneira relativamente simples de capturar o significado de uma sentença. A construção de parsers AMR é em grande parte baseada em córpus de referência anotados por humanos. Contudo, esse recurso é ainda bastante escasso para muitas línguas como o português. Por esse motivo, várias pesquisas têm explorado o uso de abordagens entre línguas (cross-lingual), que partem de córpus e parser existentes em uma língua fonte, para o desenvolvimento de recursos semânticos para outras línguas alvo. Dado esse contexto, este artigo descreve o XPTA, um parser AMR para o português (PT) que se baseia na abordagem entre línguas (cross-lingual, X). O XPTA parte de parser AMR existente para o inglês e de vários recursos linguísticos-computacionais bilíngues inglês--português e mapeia o conhecimento semântico disponível no inglês para a representação do significado equivalente em português. Uma avaliação automática do XPTA mostrou que a abordagem adotada é promissora e os valores obtidos para Smatch (66%, no melhor caso) apontaram que o modelo tem potencial para competir com os resultados apresentados na literatura para outros idiomas. Além da análise automática, uma análise qualitativa dos grafos gerados possibilitou identificar e categorizar os principais erros do modelo e suas possíveis causas.","PeriodicalId":41819,"journal":{"name":"Linguamatica","volume":"14 1","pages":"49-68"},"PeriodicalIF":0.1000,"publicationDate":"2022-07-02","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"XPTA: um parser AMR para o Português baseado em uma abordagem entre línguas\",\"authors\":\"E. Seno, Helena de Medeiros Caseli, M. Inácio, Rafael Torres Anchiêta, Renata Ramisch\",\"doi\":\"10.21814/lm.14.1.359\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"O crescente interesse pelo processamento semântico automático, especialmente por parte dos pesquisadores de Compreensão e de Geração de Língua Natural, tem levado a muitas pesquisas relacionadas ao desenvolvimento de parsers semânticos. E, nesse contexto, a AMR (Abstract Meaning Representation) é um dos formalismos de representação semântica que tem recebido mais atenção recentemente, devido à sua maneira relativamente simples de capturar o significado de uma sentença. A construção de parsers AMR é em grande parte baseada em córpus de referência anotados por humanos. Contudo, esse recurso é ainda bastante escasso para muitas línguas como o português. Por esse motivo, várias pesquisas têm explorado o uso de abordagens entre línguas (cross-lingual), que partem de córpus e parser existentes em uma língua fonte, para o desenvolvimento de recursos semânticos para outras línguas alvo. Dado esse contexto, este artigo descreve o XPTA, um parser AMR para o português (PT) que se baseia na abordagem entre línguas (cross-lingual, X). O XPTA parte de parser AMR existente para o inglês e de vários recursos linguísticos-computacionais bilíngues inglês--português e mapeia o conhecimento semântico disponível no inglês para a representação do significado equivalente em português. Uma avaliação automática do XPTA mostrou que a abordagem adotada é promissora e os valores obtidos para Smatch (66%, no melhor caso) apontaram que o modelo tem potencial para competir com os resultados apresentados na literatura para outros idiomas. Além da análise automática, uma análise qualitativa dos grafos gerados possibilitou identificar e categorizar os principais erros do modelo e suas possíveis causas.\",\"PeriodicalId\":41819,\"journal\":{\"name\":\"Linguamatica\",\"volume\":\"14 1\",\"pages\":\"49-68\"},\"PeriodicalIF\":0.1000,\"publicationDate\":\"2022-07-02\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Linguamatica\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.21814/lm.14.1.359\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"Q4\",\"JCRName\":\"LINGUISTICS\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Linguamatica","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.21814/lm.14.1.359","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q4","JCRName":"LINGUISTICS","Score":null,"Total":0}

引用次数: 0

摘要

对自动语义处理的兴趣日益浓厚，特别是自然语言理解和生成研究者的兴趣，导致了许多与语义解析器开发相关的研究。在这种背景下，抽象意义表示(AMR)是语义表示的一种形式形式，由于其捕捉句子意义的相对简单的方法，近年来受到了更多的关注。AMR解析器的构建主要基于人类注释的参考语料库。然而，对于像葡萄牙语这样的许多语言来说，这一功能仍然非常稀缺。因此，一些研究探索了跨语言方法的使用，即从源语言中现有的语料库和解析器开始，为其他目标语言开发语义资源。的背景下,这篇文章描述了一个解析器XPTA, AMR的葡萄牙语(PT)基于语言方法(十字-lingual解析器,X) XPTA AMR现有英语语言资源和各种-computacionais双语英语图书馆与语义地图的知识在英语葡萄牙语表示的意义是相同的。对XPTA的自动评估表明，采用的方法是有前途的，Smatch的值(最好是66%)表明，该模型有潜力与文献中其他语言的结果竞争。除了自动分析外，对生成的图进行定性分析，还可以识别和分类模型的主要错误及其可能的原因。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

查看原文本刊更多论文

XPTA: um parser AMR para o Português baseado em uma abordagem entre línguas

O crescente interesse pelo processamento semântico automático, especialmente por parte dos pesquisadores de Compreensão e de Geração de Língua Natural, tem levado a muitas pesquisas relacionadas ao desenvolvimento de parsers semânticos. E, nesse contexto, a AMR (Abstract Meaning Representation) é um dos formalismos de representação semântica que tem recebido mais atenção recentemente, devido à sua maneira relativamente simples de capturar o significado de uma sentença. A construção de parsers AMR é em grande parte baseada em córpus de referência anotados por humanos. Contudo, esse recurso é ainda bastante escasso para muitas línguas como o português. Por esse motivo, várias pesquisas têm explorado o uso de abordagens entre línguas (cross-lingual), que partem de córpus e parser existentes em uma língua fonte, para o desenvolvimento de recursos semânticos para outras línguas alvo. Dado esse contexto, este artigo descreve o XPTA, um parser AMR para o português (PT) que se baseia na abordagem entre línguas (cross-lingual, X). O XPTA parte de parser AMR existente para o inglês e de vários recursos linguísticos-computacionais bilíngues inglês--português e mapeia o conhecimento semântico disponível no inglês para a representação do significado equivalente em português. Uma avaliação automática do XPTA mostrou que a abordagem adotada é promissora e os valores obtidos para Smatch (66%, no melhor caso) apontaram que o modelo tem potencial para competir com os resultados apresentados na literatura para outros idiomas. Além da análise automática, uma análise qualitativa dos grafos gerados possibilitou identificar e categorizar os principais erros do modelo e suas possíveis causas.

求助全文

通过发布文献求助，成功后即可免费获取论文全文。去求助

来源期刊

Linguamatica LINGUISTICS-

CiteScore

1.40

自引率

0.00%

发文量

审稿时长

6 weeks