Japanese Sentence Dataset for Lip- reading

2021 17th International Conference on Machine Vision and Applications (MVA) Pub Date : 2021-07-25 DOI:10.23919/MVA51890.2021.9511353

Tatsuya Shirakata, T. Saitoh

引用次数: 2

Abstract

This research is about lip-reading for Japanese sentences. Research on English sentences is actively pursued due to the extensive datasets. However, a sufficient dataset for Japanese sentences has not been released. Therefore, this paper builds a Japanese sentence dataset. A Transformer model is used for the recognition task. Three recognition target levels: phoneme, mora, and vowel, are set, and recognition experiments show that they can be recognized.

查看原文本刊更多论文

唇读日语句子数据集

本研究是关于日语句子的唇读。由于数据集广泛，对英语句子的研究正在积极进行。然而，一个足够的日语句子数据集还没有发布。因此，本文构建了一个日语句子数据集。Transformer模型用于识别任务。设置了音素、母素和元音三个识别目标层次，并通过识别实验验证了识别目标的有效性。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊