A Step-by-Step Process for Building TTS Voices Using Open Source Data and Frameworks for Bangla, Javanese, Khmer, Nepali, Sinhala, and Sundanese

Workshop on Spoken Language Technologies for Under-resourced Languages Pub Date : 2018-08-29 DOI:10.21437/SLTU.2018-14

Keshan Sanjaya Sodimana, Pasindu De Silva, Supheakmungkol Sarin, Oddur Kjartansson, Martin Jansche, Knot Pipatsrisawat, Linne Ha

引用次数: 31

Abstract

The availability of language resources is vital for the development of text-to-speech (TTS) systems. Thus, open source resources are highly beneficial for TTS research communities focused on low-resourced languages. In this paper, we present data sets for 6 low-resourced languages that we open sourced to the public. The data sets consist of audio files, pronunciation lexicons, and phonology definitions for Bangla, Javanese, Khmer, Nepali, Sinhala, and Sundanese. These data sets are sufficient for building voices in these languages. We also describe a recipe for building a new TTS voice using our data together with openly available resources and tools.

查看原文本刊更多论文

使用开源数据和框架为孟加拉语、爪哇语、高棉语、尼泊尔语、僧伽罗语和巽他语逐步建立TTS声音的过程

语言资源的可用性对于文本到语音(TTS)系统的发展至关重要。因此，开源资源对于专注于资源匮乏语言的TTS研究社区非常有益。在这篇论文中，我们展示了6种低资源语言的数据集，我们向公众开放了它们的源代码。数据集包括音频文件、发音词汇和孟加拉语、爪哇语、高棉语、尼泊尔语、僧伽罗语和巽他语的音韵定义。这些数据集足以构建这些语言的语音。我们还描述了使用我们的数据以及公开可用的资源和工具构建新的TTS语音的方法。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊

Workshop on Spoken Language Technologies for Under-resourced Languages

自引率

0.00%

发文量