Die Rolle der Phonologie in der multilingualen Sprachtechnologie

LDV Forum Pub Date : 2003-07-01 DOI:10.21248/jlcl.18.2003.34

Julie Carson-Berndsen, M. Neugebauer

{"title":"Die Rolle der Phonologie in der multilingualen Sprachtechnologie","authors":"Julie Carson-Berndsen, M. Neugebauer","doi":"10.21248/jlcl.18.2003.34","DOIUrl":null,"url":null,"abstract":"Multilinguale Kommunikation fordert die Übertragbarkeit der gängigen Techniken auf eine große Anzahl verschiedener Sprachen und stellt damit hohe Anforderungen an die Sprachtechnologie. Obwohl die Spracherkennung und die Sprachsynthese sich in den letzten Jahren in vielen Bereichen unseres Lebens durchgesetzt haben, sind die Anwendungen häufig von einer bestimmten Domäne abhängig. Auskunftssysteme, zum Beispiel, sind so beschaffen, dass Probleme aufkommen, sobald neue Wörter erkannt oder produziert werden sollen. Während die größeren Sprachen der Welt von jeder neuen Entwicklung im sprachtechnologischen Bereich profitieren, leiden die kleineren Sprachen eher unter einem Mangel an Ressourcen und Anwendungen. Dabei ist besonders für bedrohte Sprachen der Aufbau linguistischer Ressourcen, die bei der Spracherkennung oder Sprachsynthese eingesetzt werden können, von enormer Wichtigkeit. Die meisten kommerziellen Spracherkennungssysteme bauen auf stochastischen Methoden auf, die zwar implizit linguistische Informationen beinhalten, jedoch nicht in einer Form, die sich zum Beispiel unmittelbar für die Sprachsynthese eignet. Das linguistische Wissen liegt im System versteckt und kann nicht ohne weiteres explizit aufgedeckt und weiterverwendet werden. Jedes neue System bedarf einer erneuten „Trainingsphase“, damit zusätzliches Wissen hinzugefügt werden kann. Dies setzt einen großen Datensatz voraus, der auch entsprechend annotiert werden muss. Sinnvoller scheint es hingegen, alle Daten, die für neue Anwendungen gesammelt werden, so zu repräsentieren, dass sie von verschiedenartigen Technologien weiterverwendet werden können. Der Schwerpunkt bei der weiteren Entwicklung in der Sprachtechnologie muss auf generische Techniken gelegt werden, die für alle Sprachen gelten. Nur so kann eine robuste multilinguale Sprachtechnologie entstehen, die auch skalierbar ist. Um die Portabilität sprachtechnologischer Anwendungen mit Blick auf „neue“ Sprachen zu gewährleisten, ist die Entwicklung innovativer Methoden für die Akquisition und Repräsentation linguistischer Informationen verschiedener Granularitäten unumgänglich. Mit Blick auf diesen Aspekt wird in diesem Papier eine neuartige Modellierung phonologischer Informationen präsentiert, die sowohl in dem hier vertretenen compu-","PeriodicalId":346957,"journal":{"name":"LDV Forum","volume":"401 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2003-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"1","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"LDV Forum","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.21248/jlcl.18.2003.34","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 1

Abstract

Multilinguale Kommunikation fordert die Übertragbarkeit der gängigen Techniken auf eine große Anzahl verschiedener Sprachen und stellt damit hohe Anforderungen an die Sprachtechnologie. Obwohl die Spracherkennung und die Sprachsynthese sich in den letzten Jahren in vielen Bereichen unseres Lebens durchgesetzt haben, sind die Anwendungen häufig von einer bestimmten Domäne abhängig. Auskunftssysteme, zum Beispiel, sind so beschaffen, dass Probleme aufkommen, sobald neue Wörter erkannt oder produziert werden sollen. Während die größeren Sprachen der Welt von jeder neuen Entwicklung im sprachtechnologischen Bereich profitieren, leiden die kleineren Sprachen eher unter einem Mangel an Ressourcen und Anwendungen. Dabei ist besonders für bedrohte Sprachen der Aufbau linguistischer Ressourcen, die bei der Spracherkennung oder Sprachsynthese eingesetzt werden können, von enormer Wichtigkeit. Die meisten kommerziellen Spracherkennungssysteme bauen auf stochastischen Methoden auf, die zwar implizit linguistische Informationen beinhalten, jedoch nicht in einer Form, die sich zum Beispiel unmittelbar für die Sprachsynthese eignet. Das linguistische Wissen liegt im System versteckt und kann nicht ohne weiteres explizit aufgedeckt und weiterverwendet werden. Jedes neue System bedarf einer erneuten „Trainingsphase“, damit zusätzliches Wissen hinzugefügt werden kann. Dies setzt einen großen Datensatz voraus, der auch entsprechend annotiert werden muss. Sinnvoller scheint es hingegen, alle Daten, die für neue Anwendungen gesammelt werden, so zu repräsentieren, dass sie von verschiedenartigen Technologien weiterverwendet werden können. Der Schwerpunkt bei der weiteren Entwicklung in der Sprachtechnologie muss auf generische Techniken gelegt werden, die für alle Sprachen gelten. Nur so kann eine robuste multilinguale Sprachtechnologie entstehen, die auch skalierbar ist. Um die Portabilität sprachtechnologischer Anwendungen mit Blick auf „neue“ Sprachen zu gewährleisten, ist die Entwicklung innovativer Methoden für die Akquisition und Repräsentation linguistischer Informationen verschiedener Granularitäten unumgänglich. Mit Blick auf diesen Aspekt wird in diesem Papier eine neuartige Modellierung phonologischer Informationen präsentiert, die sowohl in dem hier vertretenen compu-

查看原文本刊更多论文

语言学在多产发声系统中的作用

多语言交流要求可以携带的传统技术的可携带性，这给发声技术带来了严格的要求。尽管识别语言和合成语言在近几年在我们生活的很多方面日益普遍，但应用程序常常取决于某一特定的领域。例如，信息系统的目的是让人们在出现或产生新单词时产生问题。虽然世界上较大的语言从基因技术的每次新发展中获益，但较小的语言却必然资源和应用严重不足。建设语言资源可以用于识别语言或合成语言至关重要。大多数商业语言识别系统都依赖于随机方法，其中包含间接的语言信息，但不以可直接用于语言合成的方式运作。语言知识埋藏在这个系统之中，并不能轻易地被明确地发现和重复使用。每一个新的训练系统都需要再进行一次训练，以补充更多的知识本数据集设了一个大数据库，并且需要将它激活。相反，或许更有理由用各种技术来表示用于新应用的所有数据。发声系统的进一步发展需要集中在适用于所有语言的通用技术上只有这样才能产生出一种强大的多边化的发声系统而且可以扩展为了确保研究“新”语言的语言应用可以实现对语言的利用，必须研制出用来搜集和代表不同凯特尔类型的语言信息的创新方法。为此，介绍了一整套模拟语音信息的新方法，在这里的compu compu中呈现了这些

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊

LDV Forum

自引率

0.00%

发文量