多语言自动语言生成中多阶段原型术语的表示:从语料库到单词嵌入再到自动词典

IF 0.9 2区 文学 0 LANGUAGE & LINGUISTICS
Lexikos Pub Date : 2021-05-03 DOI:10.5788/31-1-1623
M. Vázquez
{"title":"多语言自动语言生成中多阶段原型术语的表示:从语料库到单词嵌入再到自动词典","authors":"M. Vázquez","doi":"10.5788/31-1-1623","DOIUrl":null,"url":null,"abstract":"Das multilinguale Worterbuch zur Substantivvalenz Portlex gilt als Ausgangpunkt fur die Entstehung der automatischen Sprachgeneratoren Xera und Combinatoria, deren Entwicklung und Handhabung hier prasentiert wird. Beide Prototypen dienen zur automatischen Generierung von Nominalphrasen mit ihren mono- und biargumentalen Valenzstellen, die u.a. als Worterbuchbeispiele oder als integrierte Bestandteile kunftiger autonomer E-Learning-Tools eine Anwendung finden konnten. Als Modelle fur neuartige automatische Valenzworterbucher mit Benutzerinteraktion fassen wir die Sprachgeneratoren in ihrem heutigen Zustand auf. Bei dem spezifischen methodologischen Verfahren zur Entwicklung der Sprachgeneratoren stellt sich die syntaktisch-semantische Beschreibung der vom Valenztrager eroffneten Leerstellen aus syntagmatischer und paradigmatischer Sicht als Schwerpunkt heraus. Zusammen mit Faktoren wie der Reprasentativitat, der grammatischen Korrektheit, der semantischen Koharenz, der Frequenz und der Vielfaltigkeit der lexikalischen Kandidaten sowie der semantischen Klassen und der Argumentstrukturen, die feste Bestandteile beider Ressourcen sind, sticht ein mehrschichtiger Prototypsbegriff hervor. Die kombinierte Anwendung dieses Prototypbegriffs sowie von word embeddings zeigt zusammen mit Techniken aus dem Gebiet der maschinellen Verarbeitung und Generation naturlicher Sprache (NLP und NLG) einen neuen Weg zur kunftigen Entwicklung von automatisch generierten plurilingualen Valenzworterbuchern. Insgesamt stellt der Beitrag die Sprachgeneratoren sowohl aus der Perspektive ihrer Entwicklung als auch aus Nutzersicht dar. Der Fokuss wird auf die Rolle des Prototypbegriffs bei der Entwicklung der Ressourcen gelegt.","PeriodicalId":43907,"journal":{"name":"Lexikos","volume":null,"pages":null},"PeriodicalIF":0.9000,"publicationDate":"2021-05-03","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"1","resultStr":"{\"title\":\"Zur Darstellung eines mehrstufigen Prototypbegriffs in der multilingualen automatischen Sprachgenerierung: vom Korpus über word embeddings bis hin zum automatischen Wörterbuch\",\"authors\":\"M. Vázquez\",\"doi\":\"10.5788/31-1-1623\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Das multilinguale Worterbuch zur Substantivvalenz Portlex gilt als Ausgangpunkt fur die Entstehung der automatischen Sprachgeneratoren Xera und Combinatoria, deren Entwicklung und Handhabung hier prasentiert wird. Beide Prototypen dienen zur automatischen Generierung von Nominalphrasen mit ihren mono- und biargumentalen Valenzstellen, die u.a. als Worterbuchbeispiele oder als integrierte Bestandteile kunftiger autonomer E-Learning-Tools eine Anwendung finden konnten. Als Modelle fur neuartige automatische Valenzworterbucher mit Benutzerinteraktion fassen wir die Sprachgeneratoren in ihrem heutigen Zustand auf. Bei dem spezifischen methodologischen Verfahren zur Entwicklung der Sprachgeneratoren stellt sich die syntaktisch-semantische Beschreibung der vom Valenztrager eroffneten Leerstellen aus syntagmatischer und paradigmatischer Sicht als Schwerpunkt heraus. Zusammen mit Faktoren wie der Reprasentativitat, der grammatischen Korrektheit, der semantischen Koharenz, der Frequenz und der Vielfaltigkeit der lexikalischen Kandidaten sowie der semantischen Klassen und der Argumentstrukturen, die feste Bestandteile beider Ressourcen sind, sticht ein mehrschichtiger Prototypsbegriff hervor. Die kombinierte Anwendung dieses Prototypbegriffs sowie von word embeddings zeigt zusammen mit Techniken aus dem Gebiet der maschinellen Verarbeitung und Generation naturlicher Sprache (NLP und NLG) einen neuen Weg zur kunftigen Entwicklung von automatisch generierten plurilingualen Valenzworterbuchern. Insgesamt stellt der Beitrag die Sprachgeneratoren sowohl aus der Perspektive ihrer Entwicklung als auch aus Nutzersicht dar. Der Fokuss wird auf die Rolle des Prototypbegriffs bei der Entwicklung der Ressourcen gelegt.\",\"PeriodicalId\":43907,\"journal\":{\"name\":\"Lexikos\",\"volume\":null,\"pages\":null},\"PeriodicalIF\":0.9000,\"publicationDate\":\"2021-05-03\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"1\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Lexikos\",\"FirstCategoryId\":\"98\",\"ListUrlMain\":\"https://doi.org/10.5788/31-1-1623\",\"RegionNum\":2,\"RegionCategory\":\"文学\",\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"0\",\"JCRName\":\"LANGUAGE & LINGUISTICS\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Lexikos","FirstCategoryId":"98","ListUrlMain":"https://doi.org/10.5788/31-1-1623","RegionNum":2,"RegionCategory":"文学","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"0","JCRName":"LANGUAGE & LINGUISTICS","Score":null,"Total":0}
引用次数: 1

摘要

关于名词配价Portlex的多语言词典是开发自动语言生成器Xera和Combinatoria的起点,这里介绍了它们的开发和处理。这两个原型都用于自动生成具有单参数和双参数化合点的名词短语,除其他外,这些短语可以用作单词书示例或作为未来自主电子学习工具的集成组件。作为具有用户交互的新型自动配价字书的模型,我们考虑了当前状态下的语音生成器。在语言生成者发展的具体方法论过程中,从句法和范式的角度对价载体打开的空位进行句法语义描述是主要关注点。再加上代表性、语法正确性、语义连贯性、候选词的频率和多样性等因素,以及作为两种资源固定组成部分的语义类别和论点结构,一个多层次的原型概念脱颖而出。该原型术语和单词嵌入与机器处理和自然语言生成(NLP和NLG)领域的技术相结合的应用,为未来自动生成多语言配价单词书的发展开辟了一条新的道路。总之,本文从语言生成器的开发角度和用户的角度介绍了它们。重点是原型概念在资源开发中的作用。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
Zur Darstellung eines mehrstufigen Prototypbegriffs in der multilingualen automatischen Sprachgenerierung: vom Korpus über word embeddings bis hin zum automatischen Wörterbuch
Das multilinguale Worterbuch zur Substantivvalenz Portlex gilt als Ausgangpunkt fur die Entstehung der automatischen Sprachgeneratoren Xera und Combinatoria, deren Entwicklung und Handhabung hier prasentiert wird. Beide Prototypen dienen zur automatischen Generierung von Nominalphrasen mit ihren mono- und biargumentalen Valenzstellen, die u.a. als Worterbuchbeispiele oder als integrierte Bestandteile kunftiger autonomer E-Learning-Tools eine Anwendung finden konnten. Als Modelle fur neuartige automatische Valenzworterbucher mit Benutzerinteraktion fassen wir die Sprachgeneratoren in ihrem heutigen Zustand auf. Bei dem spezifischen methodologischen Verfahren zur Entwicklung der Sprachgeneratoren stellt sich die syntaktisch-semantische Beschreibung der vom Valenztrager eroffneten Leerstellen aus syntagmatischer und paradigmatischer Sicht als Schwerpunkt heraus. Zusammen mit Faktoren wie der Reprasentativitat, der grammatischen Korrektheit, der semantischen Koharenz, der Frequenz und der Vielfaltigkeit der lexikalischen Kandidaten sowie der semantischen Klassen und der Argumentstrukturen, die feste Bestandteile beider Ressourcen sind, sticht ein mehrschichtiger Prototypsbegriff hervor. Die kombinierte Anwendung dieses Prototypbegriffs sowie von word embeddings zeigt zusammen mit Techniken aus dem Gebiet der maschinellen Verarbeitung und Generation naturlicher Sprache (NLP und NLG) einen neuen Weg zur kunftigen Entwicklung von automatisch generierten plurilingualen Valenzworterbuchern. Insgesamt stellt der Beitrag die Sprachgeneratoren sowohl aus der Perspektive ihrer Entwicklung als auch aus Nutzersicht dar. Der Fokuss wird auf die Rolle des Prototypbegriffs bei der Entwicklung der Ressourcen gelegt.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
Lexikos
Lexikos Multiple-
CiteScore
1.00
自引率
25.00%
发文量
15
审稿时长
7 weeks
期刊介绍: Lexikos (Greek for "of or for words") is a journal for the lexicographical specialist. It is the only journal in Africa which is exclusively devoted to lexicography. Articles dealing with all aspects of lexicography and terminology or the implications that research in related disciplines such as linguistics, computer and information science, etc. has for lexicography will be considered for publication. Articles may be written in Afrikaans, English, Dutch, German and French.
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信