EXPERIENCE OF TEACHING LINGUISTICS STUDENTS HOW TO POST-EDIT MACHINE-GENERATED TRANSLATION (BASED ON ENGLISH-RUSSIAN TRANSLATIONS VIA GOOGLE TRANSLATE, YANDEX TRANSLATE AND PROMT SYSTEMS)

N. A. Panasenkov
{"title":"EXPERIENCE OF TEACHING LINGUISTICS STUDENTS HOW TO POST-EDIT MACHINE-GENERATED TRANSLATION (BASED ON ENGLISH-RUSSIAN TRANSLATIONS VIA GOOGLE TRANSLATE, YANDEX TRANSLATE AND PROMT SYSTEMS)","authors":"N. A. Panasenkov","doi":"10.26170/po19-01-08","DOIUrl":null,"url":null,"abstract":"The present study acquaints the readers with the experience of teaching future linguists how to post-edit machine translation on the material of English-Russian translations. The experiment was carried out on a sample of third year students of Department of Foreign Languages and Translation of the Ural Federal University in the course of \"New Information Technologies in Linguistics\". The main goal of this course is to acquaint future specialists with electronic toolkits of a translator that significantly simplify the search for the necessary information to perform specific translation tasks. One of the basic translation technologies today, in addition to electronic dictionaries, is the possibility of preliminary machine translation of the text. The translator can choose one or another automatic translation system that they are going to work with in the future. To this end, first of all, it is necessary to choose the most suitable machine translation system to work with. Specifically, we considered the quality and adequacy of automated translation, some typical errors and distortions, as well as the relative speed and efficiency of the post-editing process. The paper is based on the translation of specialized texts of different orientation via such systems as Google Translate, Yandex Translate and Promt. The questionnaire method is used in the study. The article contains the comments and the feedback from the students about their own work experience with one or another machine translation system, the conclusions about the adequacy of the results obtained, as well as about the importance of the post-editing process and the use of electronic dictionaries. а сегодняшний день через Интернет ежедневно передаются огромные объемы информации. Разумеется, и требования к ней предъявляются высокие: актуальность, доступность, грамотное изложение. С учетом мультиязычности пользователей Всемирной сети встает вопрос быстрого и качественного перевода массивов текстов. Так, А. Н. Усачева подчеркивает, что сеть Интернет и доступ к информационным базам данных изменили профессию переводчика практически до неузнаваемости [15]. В таких условиях на передний план выходят системы машинного перевода, которые могут обеспечить перевод в более сжатые сроки, чем переводчик. В самом общем виде программа машинного (автоматического) перевода самоН © Панасенков Н. А., 2019 ПРОФЕССИОНАЛЬНОЕ ОБРАЗОВАНИЕ 56 стоятельно осуществляет перевод текста с одного естественного языка на другой [8, с. 15]. Бытует мнение, что в недалеком будущем переводчики и вовсе могут остаться без работы: их вытеснят системы машинного перевода (МП). Действительно, за последние несколько лет системы машинного перевода совершили качественный скачок в своем развитии. В профессиональной среде специалисты отмечают «одно неоспоримое преимущество — значительная экономия времени» [10, с. 68] при переводе больших объемов информации. При этом МП целесообразно использовать при переводе специализированных текстов, где требуется единство стиля и терминологии, отсутствуют различные непонятные для машины культурные явления, идиомы, изобразительно-выразительные средства речи. Тем не менее такие системы имеют ряд недостатков, устранение которых требует участия человека-переводчика в процессе постредактирования [14]. Постредактирование — своего рода редактирование продукта автоматического перевода специалистом для получения перевода более высокого качества «с помощью минимальных усилий» [9, с. 66]. Как правило, постредакторами являются профессиональные лингвисты-переводчики, которые хорошо представляют себе все тонкости машинного перевода. Это позволяет им определить, что именно необходимо изменить в результате МП, усовершенствовав тем самым процесс перевода. Следовательно, для повышения конкурентоспособности лингвисту-переводчику необходимо овладеть навыками эффективной работы с большими объемами информации и умением решать профессиональные задачи при помощи современных компьютерных программ перевода. Поэтому обучение будущих специалистов правильному использованию таких программ является приоритетным направлением [11]. Исследование проводилось при участии студентов-бакалавров 3 курса кафедры иностранных языков и перевода УрФУ в рамках курса «Новые информационные технологии в лингвистике». Основная задача преподавателя — рассказать будущим специалистам об электронном инструментарии переводчика, который позволит существенно облегчить поиск необходимой информации в условиях конкретной рабочей ситуации, и продемонстрировать работу подобных программ. Одной из базовых переводческих технологий на сегодняшний день, помимо электронных словарей, является возможность предварительного машинного перевода текстов. Специалист может выбрать ту или иную систему автоматического перевода, с которой будет работать в дальнейшем. Соответственно прежде всего необходимо определиться с наиболее подходящей для работы системой машинного перевода. На сегодняшний день самыми известными и наиболее используемыми являются такие, как «Яндекс Переводчик», «Promt» и «Google Translate». «Promt» относится к категории систем, работающих на основе грамматических правил (Rule-Based Machine Translation, RBMT). Данная технология базируется на сопоставлении лексических единиц и грамматических правил конкретных языков. Качество такого перевода находится в прямой зависимости от объемов лингвистических баз данных (словарей) и глубины описания естественных языков [10; 12; 14]. К преимуществам RBMT-систем можно отнести синтаксическую точность и предсказуемость результата; такие системы можно настроить на предметную область. Основным недостатком является необходимость поддержания и постоянного обновления баз данных. «Яндекс Переводчик» и «Google Translate» относятся к статистическим системам МП (Statistical Machine Translation, SMT). Данная технология основана на поиске наиболее вероятного варианта перевода в двуязычных базах данных (корпусах). SMT имеет возможности «самообучения»: чем больше параллельных текстов и чем точнее они соответствуют друг другу, тем лучше результат перевода. В качестве преимуществ SMT-систем можно отметить гладкость перевода и переносимость технологии на любые языковые пары. Среди недостатков отмечают отсутствие корпусов у некоторых языков, неумение систем справляться с морфологией и синтаксисом, искажение информации [10; 12]. Более того, «Google Translate» находится в сильной позиции по отношению к другим системам, когда речь идет о переводе с/на английский, так как данный язык изначально лежал в основе системы и до сих пор является языкомпосредником при работе с другими парами языков. Суть эксперимента сводилась к следующему: студенты 3 курса в количестве 12 человек разделились на 3 группы по 4 человека; каждая из групп работала с одной из трех систем машинного перевода. У каждого студента была собственная статья на английском языке по теме, которую он сам выбрал для перевода (экономического, политического, технического и медицинского толка). Среднее количество знаков в статье (с пробелами) не превышало 4 тысяч (как правило, 3500—4000), а время выполнения задания ограничивалось одной парой (90 минут). Студентам предлагалось выполнить ПЕДАГОГИЧЕСКОЕ ОБРАЗОВАНИЕ В РОССИИ. 2019. No 1 57 постредактирование машинного перевода статей в соответствующей системе и ответить на вопросы. Ниже представлены наиболее интересные и полные ответы студентов по каждой из систем машинного перевода с примерами и пояснениями.","PeriodicalId":430995,"journal":{"name":"Pedagogical Education in Russia","volume":"442 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"1900-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"3","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Pedagogical Education in Russia","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.26170/po19-01-08","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 3

Abstract

The present study acquaints the readers with the experience of teaching future linguists how to post-edit machine translation on the material of English-Russian translations. The experiment was carried out on a sample of third year students of Department of Foreign Languages and Translation of the Ural Federal University in the course of "New Information Technologies in Linguistics". The main goal of this course is to acquaint future specialists with electronic toolkits of a translator that significantly simplify the search for the necessary information to perform specific translation tasks. One of the basic translation technologies today, in addition to electronic dictionaries, is the possibility of preliminary machine translation of the text. The translator can choose one or another automatic translation system that they are going to work with in the future. To this end, first of all, it is necessary to choose the most suitable machine translation system to work with. Specifically, we considered the quality and adequacy of automated translation, some typical errors and distortions, as well as the relative speed and efficiency of the post-editing process. The paper is based on the translation of specialized texts of different orientation via such systems as Google Translate, Yandex Translate and Promt. The questionnaire method is used in the study. The article contains the comments and the feedback from the students about their own work experience with one or another machine translation system, the conclusions about the adequacy of the results obtained, as well as about the importance of the post-editing process and the use of electronic dictionaries. а сегодняшний день через Интернет ежедневно передаются огромные объемы информации. Разумеется, и требования к ней предъявляются высокие: актуальность, доступность, грамотное изложение. С учетом мультиязычности пользователей Всемирной сети встает вопрос быстрого и качественного перевода массивов текстов. Так, А. Н. Усачева подчеркивает, что сеть Интернет и доступ к информационным базам данных изменили профессию переводчика практически до неузнаваемости [15]. В таких условиях на передний план выходят системы машинного перевода, которые могут обеспечить перевод в более сжатые сроки, чем переводчик. В самом общем виде программа машинного (автоматического) перевода самоН © Панасенков Н. А., 2019 ПРОФЕССИОНАЛЬНОЕ ОБРАЗОВАНИЕ 56 стоятельно осуществляет перевод текста с одного естественного языка на другой [8, с. 15]. Бытует мнение, что в недалеком будущем переводчики и вовсе могут остаться без работы: их вытеснят системы машинного перевода (МП). Действительно, за последние несколько лет системы машинного перевода совершили качественный скачок в своем развитии. В профессиональной среде специалисты отмечают «одно неоспоримое преимущество — значительная экономия времени» [10, с. 68] при переводе больших объемов информации. При этом МП целесообразно использовать при переводе специализированных текстов, где требуется единство стиля и терминологии, отсутствуют различные непонятные для машины культурные явления, идиомы, изобразительно-выразительные средства речи. Тем не менее такие системы имеют ряд недостатков, устранение которых требует участия человека-переводчика в процессе постредактирования [14]. Постредактирование — своего рода редактирование продукта автоматического перевода специалистом для получения перевода более высокого качества «с помощью минимальных усилий» [9, с. 66]. Как правило, постредакторами являются профессиональные лингвисты-переводчики, которые хорошо представляют себе все тонкости машинного перевода. Это позволяет им определить, что именно необходимо изменить в результате МП, усовершенствовав тем самым процесс перевода. Следовательно, для повышения конкурентоспособности лингвисту-переводчику необходимо овладеть навыками эффективной работы с большими объемами информации и умением решать профессиональные задачи при помощи современных компьютерных программ перевода. Поэтому обучение будущих специалистов правильному использованию таких программ является приоритетным направлением [11]. Исследование проводилось при участии студентов-бакалавров 3 курса кафедры иностранных языков и перевода УрФУ в рамках курса «Новые информационные технологии в лингвистике». Основная задача преподавателя — рассказать будущим специалистам об электронном инструментарии переводчика, который позволит существенно облегчить поиск необходимой информации в условиях конкретной рабочей ситуации, и продемонстрировать работу подобных программ. Одной из базовых переводческих технологий на сегодняшний день, помимо электронных словарей, является возможность предварительного машинного перевода текстов. Специалист может выбрать ту или иную систему автоматического перевода, с которой будет работать в дальнейшем. Соответственно прежде всего необходимо определиться с наиболее подходящей для работы системой машинного перевода. На сегодняшний день самыми известными и наиболее используемыми являются такие, как «Яндекс Переводчик», «Promt» и «Google Translate». «Promt» относится к категории систем, работающих на основе грамматических правил (Rule-Based Machine Translation, RBMT). Данная технология базируется на сопоставлении лексических единиц и грамматических правил конкретных языков. Качество такого перевода находится в прямой зависимости от объемов лингвистических баз данных (словарей) и глубины описания естественных языков [10; 12; 14]. К преимуществам RBMT-систем можно отнести синтаксическую точность и предсказуемость результата; такие системы можно настроить на предметную область. Основным недостатком является необходимость поддержания и постоянного обновления баз данных. «Яндекс Переводчик» и «Google Translate» относятся к статистическим системам МП (Statistical Machine Translation, SMT). Данная технология основана на поиске наиболее вероятного варианта перевода в двуязычных базах данных (корпусах). SMT имеет возможности «самообучения»: чем больше параллельных текстов и чем точнее они соответствуют друг другу, тем лучше результат перевода. В качестве преимуществ SMT-систем можно отметить гладкость перевода и переносимость технологии на любые языковые пары. Среди недостатков отмечают отсутствие корпусов у некоторых языков, неумение систем справляться с морфологией и синтаксисом, искажение информации [10; 12]. Более того, «Google Translate» находится в сильной позиции по отношению к другим системам, когда речь идет о переводе с/на английский, так как данный язык изначально лежал в основе системы и до сих пор является языкомпосредником при работе с другими парами языков. Суть эксперимента сводилась к следующему: студенты 3 курса в количестве 12 человек разделились на 3 группы по 4 человека; каждая из групп работала с одной из трех систем машинного перевода. У каждого студента была собственная статья на английском языке по теме, которую он сам выбрал для перевода (экономического, политического, технического и медицинского толка). Среднее количество знаков в статье (с пробелами) не превышало 4 тысяч (как правило, 3500—4000), а время выполнения задания ограничивалось одной парой (90 минут). Студентам предлагалось выполнить ПЕДАГОГИЧЕСКОЕ ОБРАЗОВАНИЕ В РОССИИ. 2019. No 1 57 постредактирование машинного перевода статей в соответствующей системе и ответить на вопросы. Ниже представлены наиболее интересные и полные ответы студентов по каждой из систем машинного перевода с примерами и пояснениями.
教授语言学学生如何对机器生成的翻译进行后期编辑的经验(基于通过Google翻译、yandex翻译和提示系统进行的英俄翻译)
目前最著名和最常用的是yandex翻译、Promt和谷歌翻译。“Promt”是一种基于语法规则的系统(RBMT)。这种技术是基于比较词汇单元和特定语言的语法规则。这种翻译的质量直接取决于语言数据库(字典)的数量和自然语言描述的深度(10;12;14)。RBMT系统的优点可以归因于结果的句法准确性和可预测性;这些系统可以设置为目标区域。主要的缺点是需要维护和不断更新数据库。yandex翻译和谷歌翻译是asp统计系统(SMT)的一部分。这项技术是基于在双语数据库中寻找最有可能的翻译。SMT有“自学”的能力:平行文本越多,它们对应得越精确,翻译的效果就越好。SMT系统的好处是,它可以很容易地将技术翻译成任何语言对。缺点包括一些语言缺乏外壳,系统无法处理形态和句法,信息扭曲(10;12)。此外,“谷歌翻译”在从/英语翻译中对其他系统具有很强的地位,因为它最初是系统的基础,现在仍然是其他语言的语言调解员。实验的重点是:3班12人被分成3组,每组4人;每个小组都在使用三种机器翻译系统中的一种。每个学生都有自己选择翻译的英文文章(经济、政治、技术和医学)。文章中字符的平均数量不超过4000个(通常是3500 - 4000个),任务时间限制在一对(90分钟)。学生被要求在俄罗斯接受教育。2019. 第157号,将文章机器翻译到相关系统中并回答问题。下面是学生对每一个机器翻译系统最有趣和完整的回答。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:604180095
Book学术官方微信