Transliteration for Cross-Lingual Morphological Inflection

Special Interest Group on Computational Morphology and Phonology Workshop Pub Date : 2020-07-01 DOI:10.18653/v1/2020.sigmorphon-1.22

Nikitha Murikinati, Antonios Anastasopoulos, Graham Neubig

引用次数: 15

Abstract

Cross-lingual transfer between typologically related languages has been proven successful for the task of morphological inflection. However, if the languages do not share the same script, current methods yield more modest improvements. We explore the use of transliteration between related languages, as well as grapheme-to-phoneme conversion, as data preprocessing methods in order to alleviate this issue. We experimented with several diverse language pairs, finding that in most cases transliterating the transfer language data into the target one leads to accuracy improvements, even up to 9 percentage points. Converting both languages into a shared space like the International Phonetic Alphabet or the Latin alphabet is also beneficial, leading to improvements of up to 16 percentage points.

查看原文本刊更多论文

跨语言形态变化的音译

在类型学相关语言之间的跨语迁移已被证明是成功的形态学变形任务。但是，如果语言不共享相同的脚本，则当前的方法产生的改进比较有限。我们探讨了相关语言之间的音译，以及字素到音素的转换，作为数据预处理方法，以缓解这一问题。我们对几种不同的语言对进行了实验，发现在大多数情况下，将迁移语言数据音译为目标语言可以提高准确性，甚至可以提高9个百分点。将两种语言转换成一个共享的空间，如国际音标或拉丁字母，也是有益的，可以提高多达16个百分点。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊

Special Interest Group on Computational Morphology and Phonology Workshop

自引率

0.00%

发文量