Using a parallel corpus to adapt the Flesch Reading Ease formula to Czech

Journal of Linguistics/Jazykovedný casopis Pub Date : 2021-12-01 DOI:10.2478/jazcas-2021-0044

Klára Bendová

引用次数: 2

Abstract

Abstract Text readability metrics assess how much effort a reader must put into comprehending a given text. They are, e.g., used to choose appropriate readings for different student proficiency levels, or to make sure that crucial information is efficiently conveyed (e.g., in an emergency). Flesch Reading Ease is such a globally used formula that it is even integrated into the MS Word Processor. However, its constants are language-dependent. The original formula was created for English. So far it has been adapted to several European languages, Bangla, and Hindi. This paper describes the Czech adaptation, with the language-dependent constants optimized by a machine-learning algorithm working on parallel corpora of Czech and English, Russian, Italian, and French, respectively.

查看原文本刊更多论文

用平行语料库将Flesch阅读简易公式改编为捷克语

文本可读性指标评估读者必须投入多少努力来理解给定的文本。例如，它们被用来为不同的学生水平选择合适的阅读材料，或者确保重要信息被有效地传达(例如，在紧急情况下)。Flesch Reading Ease是一个全球通用的公式，它甚至被集成到MS文字处理器中。然而，它的常量依赖于语言。最初的公式是为英语创建的。到目前为止，它已经被改编成几种欧洲语言、孟加拉语和印地语。本文描述了捷克语的自适应，通过机器学习算法分别在捷克语和英语、俄语、意大利语和法语的并行语料库上优化语言相关常数。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊

Journal of Linguistics/Jazykovedný casopis

自引率

0.00%

发文量