Roana Rodrigues, Ariani Di Felippo, N. T. Roman, Pedro Semcovici, Jackson Wilke da Cruz Souza, T. Pardo
{"title":"金融市场术语:对 DANTEStocks 语料库的研究","authors":"Roana Rodrigues, Ariani Di Felippo, N. T. Roman, Pedro Semcovici, Jackson Wilke da Cruz Souza, T. Pardo","doi":"10.11606/issn.2317-9511.v46p6-30","DOIUrl":null,"url":null,"abstract":"Neste artigo, são apresentados os procedimentos de extração e validação de termos do domínio do mercado financeiro em Português Brasileiro (PB) com base no corpus DANTEStocks. Para tanto, tem-se como pressuposto teórico a Teoria Comunicativa da Terminologia, que preconiza que os termos e suas propriedades só podem ser identificados e descritos no seu ambiente natural de ocorrência. Para a extração de candidatos a termos, foram aplicados padrões lexicais, resultando numa lista de 527 candidatos. Em seguida, os termos foram analisados e validados por especialistas, culminando em uma lista de 380 termos. Além disso, fez-se a verificação em outros glossários do campo semântico da Economia, em que se constatou a ausência de muitos termos do mercado financeiro. Assim, considerando a relevância dos estudos terminológicos para a Linguística e o Processamento de Línguas Naturais, a lista terminológica construída no presente trabalho possibilita a identificação dos termos da área de domínio (mercado financeiro) e sua separação (e quantificação) em relação às palavras de língua geral.","PeriodicalId":52911,"journal":{"name":"TradTerm","volume":"34 6","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2024-02-24","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Termos do mercado financeiro: um estudo do corpus DANTEStocks\",\"authors\":\"Roana Rodrigues, Ariani Di Felippo, N. T. Roman, Pedro Semcovici, Jackson Wilke da Cruz Souza, T. Pardo\",\"doi\":\"10.11606/issn.2317-9511.v46p6-30\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Neste artigo, são apresentados os procedimentos de extração e validação de termos do domínio do mercado financeiro em Português Brasileiro (PB) com base no corpus DANTEStocks. Para tanto, tem-se como pressuposto teórico a Teoria Comunicativa da Terminologia, que preconiza que os termos e suas propriedades só podem ser identificados e descritos no seu ambiente natural de ocorrência. Para a extração de candidatos a termos, foram aplicados padrões lexicais, resultando numa lista de 527 candidatos. Em seguida, os termos foram analisados e validados por especialistas, culminando em uma lista de 380 termos. Além disso, fez-se a verificação em outros glossários do campo semântico da Economia, em que se constatou a ausência de muitos termos do mercado financeiro. Assim, considerando a relevância dos estudos terminológicos para a Linguística e o Processamento de Línguas Naturais, a lista terminológica construída no presente trabalho possibilita a identificação dos termos da área de domínio (mercado financeiro) e sua separação (e quantificação) em relação às palavras de língua geral.\",\"PeriodicalId\":52911,\"journal\":{\"name\":\"TradTerm\",\"volume\":\"34 6\",\"pages\":\"\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2024-02-24\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"TradTerm\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.11606/issn.2317-9511.v46p6-30\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"TradTerm","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.11606/issn.2317-9511.v46p6-30","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
摘要
本文介绍了基于 DANTEStocks 语料库从巴西葡萄牙语(BP)金融市场领域提取和验证术语的程序。为此,本文的理论假设是术语交际理论(Communicative Theory of Terminology),该理论主张只有在术语出现的自然环境中才能识别和描述术语及其属性。为了提取候选术语,我们采用了词汇模式,最终得到了 527 个候选术语。随后,专家对这些术语进行了分析和验证,最终确定了一份包含 380 个术语的清单。此外,还检查了经济学语义领域的其他术语表,发现其中没有许多金融市场术语。因此,考虑到术语研究与语言学和自然语言处理的相关性,这项工作中构建的术语表可以识别领域(金融市场)的术语,并将它们与普通语言词汇区分开来(并进行量化)。
Termos do mercado financeiro: um estudo do corpus DANTEStocks
Neste artigo, são apresentados os procedimentos de extração e validação de termos do domínio do mercado financeiro em Português Brasileiro (PB) com base no corpus DANTEStocks. Para tanto, tem-se como pressuposto teórico a Teoria Comunicativa da Terminologia, que preconiza que os termos e suas propriedades só podem ser identificados e descritos no seu ambiente natural de ocorrência. Para a extração de candidatos a termos, foram aplicados padrões lexicais, resultando numa lista de 527 candidatos. Em seguida, os termos foram analisados e validados por especialistas, culminando em uma lista de 380 termos. Além disso, fez-se a verificação em outros glossários do campo semântico da Economia, em que se constatou a ausência de muitos termos do mercado financeiro. Assim, considerando a relevância dos estudos terminológicos para a Linguística e o Processamento de Línguas Naturais, a lista terminológica construída no presente trabalho possibilita a identificação dos termos da área de domínio (mercado financeiro) e sua separação (e quantificação) em relação às palavras de língua geral.