{"title":"Die Rolle der Phonologie in der multilingualen Sprachtechnologie","authors":"Julie Carson-Berndsen, M. Neugebauer","doi":"10.21248/jlcl.18.2003.34","DOIUrl":null,"url":null,"abstract":"Multilinguale Kommunikation fordert die Übertragbarkeit der gängigen Techniken auf eine große Anzahl verschiedener Sprachen und stellt damit hohe Anforderungen an die Sprachtechnologie. Obwohl die Spracherkennung und die Sprachsynthese sich in den letzten Jahren in vielen Bereichen unseres Lebens durchgesetzt haben, sind die Anwendungen häufig von einer bestimmten Domäne abhängig. Auskunftssysteme, zum Beispiel, sind so beschaffen, dass Probleme aufkommen, sobald neue Wörter erkannt oder produziert werden sollen. Während die größeren Sprachen der Welt von jeder neuen Entwicklung im sprachtechnologischen Bereich profitieren, leiden die kleineren Sprachen eher unter einem Mangel an Ressourcen und Anwendungen. Dabei ist besonders für bedrohte Sprachen der Aufbau linguistischer Ressourcen, die bei der Spracherkennung oder Sprachsynthese eingesetzt werden können, von enormer Wichtigkeit. Die meisten kommerziellen Spracherkennungssysteme bauen auf stochastischen Methoden auf, die zwar implizit linguistische Informationen beinhalten, jedoch nicht in einer Form, die sich zum Beispiel unmittelbar für die Sprachsynthese eignet. Das linguistische Wissen liegt im System versteckt und kann nicht ohne weiteres explizit aufgedeckt und weiterverwendet werden. Jedes neue System bedarf einer erneuten „Trainingsphase“, damit zusätzliches Wissen hinzugefügt werden kann. Dies setzt einen großen Datensatz voraus, der auch entsprechend annotiert werden muss. Sinnvoller scheint es hingegen, alle Daten, die für neue Anwendungen gesammelt werden, so zu repräsentieren, dass sie von verschiedenartigen Technologien weiterverwendet werden können. Der Schwerpunkt bei der weiteren Entwicklung in der Sprachtechnologie muss auf generische Techniken gelegt werden, die für alle Sprachen gelten. Nur so kann eine robuste multilinguale Sprachtechnologie entstehen, die auch skalierbar ist. Um die Portabilität sprachtechnologischer Anwendungen mit Blick auf „neue“ Sprachen zu gewährleisten, ist die Entwicklung innovativer Methoden für die Akquisition und Repräsentation linguistischer Informationen verschiedener Granularitäten unumgänglich. Mit Blick auf diesen Aspekt wird in diesem Papier eine neuartige Modellierung phonologischer Informationen präsentiert, die sowohl in dem hier vertretenen compu-","PeriodicalId":346957,"journal":{"name":"LDV Forum","volume":null,"pages":null},"PeriodicalIF":0.0000,"publicationDate":"2003-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"1","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"LDV Forum","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.21248/jlcl.18.2003.34","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 1
Abstract
Multilinguale Kommunikation fordert die Übertragbarkeit der gängigen Techniken auf eine große Anzahl verschiedener Sprachen und stellt damit hohe Anforderungen an die Sprachtechnologie. Obwohl die Spracherkennung und die Sprachsynthese sich in den letzten Jahren in vielen Bereichen unseres Lebens durchgesetzt haben, sind die Anwendungen häufig von einer bestimmten Domäne abhängig. Auskunftssysteme, zum Beispiel, sind so beschaffen, dass Probleme aufkommen, sobald neue Wörter erkannt oder produziert werden sollen. Während die größeren Sprachen der Welt von jeder neuen Entwicklung im sprachtechnologischen Bereich profitieren, leiden die kleineren Sprachen eher unter einem Mangel an Ressourcen und Anwendungen. Dabei ist besonders für bedrohte Sprachen der Aufbau linguistischer Ressourcen, die bei der Spracherkennung oder Sprachsynthese eingesetzt werden können, von enormer Wichtigkeit. Die meisten kommerziellen Spracherkennungssysteme bauen auf stochastischen Methoden auf, die zwar implizit linguistische Informationen beinhalten, jedoch nicht in einer Form, die sich zum Beispiel unmittelbar für die Sprachsynthese eignet. Das linguistische Wissen liegt im System versteckt und kann nicht ohne weiteres explizit aufgedeckt und weiterverwendet werden. Jedes neue System bedarf einer erneuten „Trainingsphase“, damit zusätzliches Wissen hinzugefügt werden kann. Dies setzt einen großen Datensatz voraus, der auch entsprechend annotiert werden muss. Sinnvoller scheint es hingegen, alle Daten, die für neue Anwendungen gesammelt werden, so zu repräsentieren, dass sie von verschiedenartigen Technologien weiterverwendet werden können. Der Schwerpunkt bei der weiteren Entwicklung in der Sprachtechnologie muss auf generische Techniken gelegt werden, die für alle Sprachen gelten. Nur so kann eine robuste multilinguale Sprachtechnologie entstehen, die auch skalierbar ist. Um die Portabilität sprachtechnologischer Anwendungen mit Blick auf „neue“ Sprachen zu gewährleisten, ist die Entwicklung innovativer Methoden für die Akquisition und Repräsentation linguistischer Informationen verschiedener Granularitäten unumgänglich. Mit Blick auf diesen Aspekt wird in diesem Papier eine neuartige Modellierung phonologischer Informationen präsentiert, die sowohl in dem hier vertretenen compu-