N. A. Panasenkov
求助PDF
{"title":"教授语言学学生如何对机器生成的翻译进行后期编辑的经验(基于通过Google翻译、yandex翻译和提示系统进行的英俄翻译)","authors":"N. A. Panasenkov","doi":"10.26170/po19-01-08","DOIUrl":null,"url":null,"abstract":"The present study acquaints the readers with the experience of teaching future linguists how to post-edit machine translation on the material of English-Russian translations. The experiment was carried out on a sample of third year students of Department of Foreign Languages and Translation of the Ural Federal University in the course of \"New Information Technologies in Linguistics\". The main goal of this course is to acquaint future specialists with electronic toolkits of a translator that significantly simplify the search for the necessary information to perform specific translation tasks. One of the basic translation technologies today, in addition to electronic dictionaries, is the possibility of preliminary machine translation of the text. The translator can choose one or another automatic translation system that they are going to work with in the future. To this end, first of all, it is necessary to choose the most suitable machine translation system to work with. Specifically, we considered the quality and adequacy of automated translation, some typical errors and distortions, as well as the relative speed and efficiency of the post-editing process. The paper is based on the translation of specialized texts of different orientation via such systems as Google Translate, Yandex Translate and Promt. The questionnaire method is used in the study. The article contains the comments and the feedback from the students about their own work experience with one or another machine translation system, the conclusions about the adequacy of the results obtained, as well as about the importance of the post-editing process and the use of electronic dictionaries. а сегодняшний день через Интернет ежедневно передаются огромные объемы информации. Разумеется, и требования к ней предъявляются высокие: актуальность, доступность, грамотное изложение. С учетом мультиязычности пользователей Всемирной сети встает вопрос быстрого и качественного перевода массивов текстов. Так, А. Н. Усачева подчеркивает, что сеть Интернет и доступ к информационным базам данных изменили профессию переводчика практически до неузнаваемости [15]. В таких условиях на передний план выходят системы машинного перевода, которые могут обеспечить перевод в более сжатые сроки, чем переводчик. В самом общем виде программа машинного (автоматического) перевода самоН © Панасенков Н. А., 2019 ПРОФЕССИОНАЛЬНОЕ ОБРАЗОВАНИЕ 56 стоятельно осуществляет перевод текста с одного естественного языка на другой [8, с. 15]. Бытует мнение, что в недалеком будущем переводчики и вовсе могут остаться без работы: их вытеснят системы машинного перевода (МП). Действительно, за последние несколько лет системы машинного перевода совершили качественный скачок в своем развитии. В профессиональной среде специалисты отмечают «одно неоспоримое преимущество — значительная экономия времени» [10, с. 68] при переводе больших объемов информации. При этом МП целесообразно использовать при переводе специализированных текстов, где требуется единство стиля и терминологии, отсутствуют различные непонятные для машины культурные явления, идиомы, изобразительно-выразительные средства речи. Тем не менее такие системы имеют ряд недостатков, устранение которых требует участия человека-переводчика в процессе постредактирования [14]. Постредактирование — своего рода редактирование продукта автоматического перевода специалистом для получения перевода более высокого качества «с помощью минимальных усилий» [9, с. 66]. Как правило, постредакторами являются профессиональные лингвисты-переводчики, которые хорошо представляют себе все тонкости машинного перевода. Это позволяет им определить, что именно необходимо изменить в результате МП, усовершенствовав тем самым процесс перевода. Следовательно, для повышения конкурентоспособности лингвисту-переводчику необходимо овладеть навыками эффективной работы с большими объемами информации и умением решать профессиональные задачи при помощи современных компьютерных программ перевода. Поэтому обучение будущих специалистов правильному использованию таких программ является приоритетным направлением [11]. Исследование проводилось при участии студентов-бакалавров 3 курса кафедры иностранных языков и перевода УрФУ в рамках курса «Новые информационные технологии в лингвистике». Основная задача преподавателя — рассказать будущим специалистам об электронном инструментарии переводчика, который позволит существенно облегчить поиск необходимой информации в условиях конкретной рабочей ситуации, и продемонстрировать работу подобных программ. Одной из базовых переводческих технологий на сегодняшний день, помимо электронных словарей, является возможность предварительного машинного перевода текстов. Специалист может выбрать ту или иную систему автоматического перевода, с которой будет работать в дальнейшем. Соответственно прежде всего необходимо определиться с наиболее подходящей для работы системой машинного перевода. На сегодняшний день самыми известными и наиболее используемыми являются такие, как «Яндекс Переводчик», «Promt» и «Google Translate». «Promt» относится к категории систем, работающих на основе грамматических правил (Rule-Based Machine Translation, RBMT). Данная технология базируется на сопоставлении лексических единиц и грамматических правил конкретных языков. Качество такого перевода находится в прямой зависимости от объемов лингвистических баз данных (словарей) и глубины описания естественных языков [10; 12; 14]. К преимуществам RBMT-систем можно отнести синтаксическую точность и предсказуемость результата; такие системы можно настроить на предметную область. Основным недостатком является необходимость поддержания и постоянного обновления баз данных. «Яндекс Переводчик» и «Google Translate» относятся к статистическим системам МП (Statistical Machine Translation, SMT). Данная технология основана на поиске наиболее вероятного варианта перевода в двуязычных базах данных (корпусах). SMT имеет возможности «самообучения»: чем больше параллельных текстов и чем точнее они соответствуют друг другу, тем лучше результат перевода. В качестве преимуществ SMT-систем можно отметить гладкость перевода и переносимость технологии на любые языковые пары. Среди недостатков отмечают отсутствие корпусов у некоторых языков, неумение систем справляться с морфологией и синтаксисом, искажение информации [10; 12]. Более того, «Google Translate» находится в сильной позиции по отношению к другим системам, когда речь идет о переводе с/на английский, так как данный язык изначально лежал в основе системы и до сих пор является языкомпосредником при работе с другими парами языков. Суть эксперимента сводилась к следующему: студенты 3 курса в количестве 12 человек разделились на 3 группы по 4 человека; каждая из групп работала с одной из трех систем машинного перевода. У каждого студента была собственная статья на английском языке по теме, которую он сам выбрал для перевода (экономического, политического, технического и медицинского толка). Среднее количество знаков в статье (с пробелами) не превышало 4 тысяч (как правило, 3500—4000), а время выполнения задания ограничивалось одной парой (90 минут). Студентам предлагалось выполнить ПЕДАГОГИЧЕСКОЕ ОБРАЗОВАНИЕ В РОССИИ. 2019. No 1 57 постредактирование машинного перевода статей в соответствующей системе и ответить на вопросы. Ниже представлены наиболее интересные и полные ответы студентов по каждой из систем машинного перевода с примерами и пояснениями.","PeriodicalId":430995,"journal":{"name":"Pedagogical Education in Russia","volume":"442 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"1900-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"3","resultStr":"{\"title\":\"EXPERIENCE OF TEACHING LINGUISTICS STUDENTS HOW TO POST-EDIT MACHINE-GENERATED TRANSLATION (BASED ON ENGLISH-RUSSIAN TRANSLATIONS VIA GOOGLE TRANSLATE, YANDEX TRANSLATE AND PROMT SYSTEMS)\",\"authors\":\"N. A. Panasenkov\",\"doi\":\"10.26170/po19-01-08\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"The present study acquaints the readers with the experience of teaching future linguists how to post-edit machine translation on the material of English-Russian translations. The experiment was carried out on a sample of third year students of Department of Foreign Languages and Translation of the Ural Federal University in the course of \\\"New Information Technologies in Linguistics\\\". The main goal of this course is to acquaint future specialists with electronic toolkits of a translator that significantly simplify the search for the necessary information to perform specific translation tasks. One of the basic translation technologies today, in addition to electronic dictionaries, is the possibility of preliminary machine translation of the text. The translator can choose one or another automatic translation system that they are going to work with in the future. To this end, first of all, it is necessary to choose the most suitable machine translation system to work with. Specifically, we considered the quality and adequacy of automated translation, some typical errors and distortions, as well as the relative speed and efficiency of the post-editing process. The paper is based on the translation of specialized texts of different orientation via such systems as Google Translate, Yandex Translate and Promt. The questionnaire method is used in the study. The article contains the comments and the feedback from the students about their own work experience with one or another machine translation system, the conclusions about the adequacy of the results obtained, as well as about the importance of the post-editing process and the use of electronic dictionaries. а сегодняшний день через Интернет ежедневно передаются огромные объемы информации. Разумеется, и требования к ней предъявляются высокие: актуальность, доступность, грамотное изложение. С учетом мультиязычности пользователей Всемирной сети встает вопрос быстрого и качественного перевода массивов текстов. Так, А. Н. Усачева подчеркивает, что сеть Интернет и доступ к информационным базам данных изменили профессию переводчика практически до неузнаваемости [15]. В таких условиях на передний план выходят системы машинного перевода, которые могут обеспечить перевод в более сжатые сроки, чем переводчик. В самом общем виде программа машинного (автоматического) перевода самоН © Панасенков Н. А., 2019 ПРОФЕССИОНАЛЬНОЕ ОБРАЗОВАНИЕ 56 стоятельно осуществляет перевод текста с одного естественного языка на другой [8, с. 15]. Бытует мнение, что в недалеком будущем переводчики и вовсе могут остаться без работы: их вытеснят системы машинного перевода (МП). Действительно, за последние несколько лет системы машинного перевода совершили качественный скачок в своем развитии. В профессиональной среде специалисты отмечают «одно неоспоримое преимущество — значительная экономия времени» [10, с. 68] при переводе больших объемов информации. При этом МП целесообразно использовать при переводе специализированных текстов, где требуется единство стиля и терминологии, отсутствуют различные непонятные для машины культурные явления, идиомы, изобразительно-выразительные средства речи. Тем не менее такие системы имеют ряд недостатков, устранение которых требует участия человека-переводчика в процессе постредактирования [14]. Постредактирование — своего рода редактирование продукта автоматического перевода специалистом для получения перевода более высокого качества «с помощью минимальных усилий» [9, с. 66]. Как правило, постредакторами являются профессиональные лингвисты-переводчики, которые хорошо представляют себе все тонкости машинного перевода. Это позволяет им определить, что именно необходимо изменить в результате МП, усовершенствовав тем самым процесс перевода. Следовательно, для повышения конкурентоспособности лингвисту-переводчику необходимо овладеть навыками эффективной работы с большими объемами информации и умением решать профессиональные задачи при помощи современных компьютерных программ перевода. Поэтому обучение будущих специалистов правильному использованию таких программ является приоритетным направлением [11]. Исследование проводилось при участии студентов-бакалавров 3 курса кафедры иностранных языков и перевода УрФУ в рамках курса «Новые информационные технологии в лингвистике». Основная задача преподавателя — рассказать будущим специалистам об электронном инструментарии переводчика, который позволит существенно облегчить поиск необходимой информации в условиях конкретной рабочей ситуации, и продемонстрировать работу подобных программ. Одной из базовых переводческих технологий на сегодняшний день, помимо электронных словарей, является возможность предварительного машинного перевода текстов. Специалист может выбрать ту или иную систему автоматического перевода, с которой будет работать в дальнейшем. Соответственно прежде всего необходимо определиться с наиболее подходящей для работы системой машинного перевода. На сегодняшний день самыми известными и наиболее используемыми являются такие, как «Яндекс Переводчик», «Promt» и «Google Translate». «Promt» относится к категории систем, работающих на основе грамматических правил (Rule-Based Machine Translation, RBMT). Данная технология базируется на сопоставлении лексических единиц и грамматических правил конкретных языков. Качество такого перевода находится в прямой зависимости от объемов лингвистических баз данных (словарей) и глубины описания естественных языков [10; 12; 14]. К преимуществам RBMT-систем можно отнести синтаксическую точность и предсказуемость результата; такие системы можно настроить на предметную область. Основным недостатком является необходимость поддержания и постоянного обновления баз данных. «Яндекс Переводчик» и «Google Translate» относятся к статистическим системам МП (Statistical Machine Translation, SMT). Данная технология основана на поиске наиболее вероятного варианта перевода в двуязычных базах данных (корпусах). SMT имеет возможности «самообучения»: чем больше параллельных текстов и чем точнее они соответствуют друг другу, тем лучше результат перевода. В качестве преимуществ SMT-систем можно отметить гладкость перевода и переносимость технологии на любые языковые пары. Среди недостатков отмечают отсутствие корпусов у некоторых языков, неумение систем справляться с морфологией и синтаксисом, искажение информации [10; 12]. Более того, «Google Translate» находится в сильной позиции по отношению к другим системам, когда речь идет о переводе с/на английский, так как данный язык изначально лежал в основе системы и до сих пор является языкомпосредником при работе с другими парами языков. Суть эксперимента сводилась к следующему: студенты 3 курса в количестве 12 человек разделились на 3 группы по 4 человека; каждая из групп работала с одной из трех систем машинного перевода. У каждого студента была собственная статья на английском языке по теме, которую он сам выбрал для перевода (экономического, политического, технического и медицинского толка). Среднее количество знаков в статье (с пробелами) не превышало 4 тысяч (как правило, 3500—4000), а время выполнения задания ограничивалось одной парой (90 минут). Студентам предлагалось выполнить ПЕДАГОГИЧЕСКОЕ ОБРАЗОВАНИЕ В РОССИИ. 2019. No 1 57 постредактирование машинного перевода статей в соответствующей системе и ответить на вопросы. Ниже представлены наиболее интересные и полные ответы студентов по каждой из систем машинного перевода с примерами и пояснениями.\",\"PeriodicalId\":430995,\"journal\":{\"name\":\"Pedagogical Education in Russia\",\"volume\":\"442 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"1900-01-01\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"3\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Pedagogical Education in Russia\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.26170/po19-01-08\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Pedagogical Education in Russia","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.26170/po19-01-08","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 3
引用
批量引用
EXPERIENCE OF TEACHING LINGUISTICS STUDENTS HOW TO POST-EDIT MACHINE-GENERATED TRANSLATION (BASED ON ENGLISH-RUSSIAN TRANSLATIONS VIA GOOGLE TRANSLATE, YANDEX TRANSLATE AND PROMT SYSTEMS)
The present study acquaints the readers with the experience of teaching future linguists how to post-edit machine translation on the material of English-Russian translations. The experiment was carried out on a sample of third year students of Department of Foreign Languages and Translation of the Ural Federal University in the course of "New Information Technologies in Linguistics". The main goal of this course is to acquaint future specialists with electronic toolkits of a translator that significantly simplify the search for the necessary information to perform specific translation tasks. One of the basic translation technologies today, in addition to electronic dictionaries, is the possibility of preliminary machine translation of the text. The translator can choose one or another automatic translation system that they are going to work with in the future. To this end, first of all, it is necessary to choose the most suitable machine translation system to work with. Specifically, we considered the quality and adequacy of automated translation, some typical errors and distortions, as well as the relative speed and efficiency of the post-editing process. The paper is based on the translation of specialized texts of different orientation via such systems as Google Translate, Yandex Translate and Promt. The questionnaire method is used in the study. The article contains the comments and the feedback from the students about their own work experience with one or another machine translation system, the conclusions about the adequacy of the results obtained, as well as about the importance of the post-editing process and the use of electronic dictionaries. а сегодняшний день через Интернет ежедневно передаются огромные объемы информации. Разумеется, и требования к ней предъявляются высокие: актуальность, доступность, грамотное изложение. С учетом мультиязычности пользователей Всемирной сети встает вопрос быстрого и качественного перевода массивов текстов. Так, А. Н. Усачева подчеркивает, что сеть Интернет и доступ к информационным базам данных изменили профессию переводчика практически до неузнаваемости [15]. В таких условиях на передний план выходят системы машинного перевода, которые могут обеспечить перевод в более сжатые сроки, чем переводчик. В самом общем виде программа машинного (автоматического) перевода самоН © Панасенков Н. А., 2019 ПРОФЕССИОНАЛЬНОЕ ОБРАЗОВАНИЕ 56 стоятельно осуществляет перевод текста с одного естественного языка на другой [8, с. 15]. Бытует мнение, что в недалеком будущем переводчики и вовсе могут остаться без работы: их вытеснят системы машинного перевода (МП). Действительно, за последние несколько лет системы машинного перевода совершили качественный скачок в своем развитии. В профессиональной среде специалисты отмечают «одно неоспоримое преимущество — значительная экономия времени» [10, с. 68] при переводе больших объемов информации. При этом МП целесообразно использовать при переводе специализированных текстов, где требуется единство стиля и терминологии, отсутствуют различные непонятные для машины культурные явления, идиомы, изобразительно-выразительные средства речи. Тем не менее такие системы имеют ряд недостатков, устранение которых требует участия человека-переводчика в процессе постредактирования [14]. Постредактирование — своего рода редактирование продукта автоматического перевода специалистом для получения перевода более высокого качества «с помощью минимальных усилий» [9, с. 66]. Как правило, постредакторами являются профессиональные лингвисты-переводчики, которые хорошо представляют себе все тонкости машинного перевода. Это позволяет им определить, что именно необходимо изменить в результате МП, усовершенствовав тем самым процесс перевода. Следовательно, для повышения конкурентоспособности лингвисту-переводчику необходимо овладеть навыками эффективной работы с большими объемами информации и умением решать профессиональные задачи при помощи современных компьютерных программ перевода. Поэтому обучение будущих специалистов правильному использованию таких программ является приоритетным направлением [11]. Исследование проводилось при участии студентов-бакалавров 3 курса кафедры иностранных языков и перевода УрФУ в рамках курса «Новые информационные технологии в лингвистике». Основная задача преподавателя — рассказать будущим специалистам об электронном инструментарии переводчика, который позволит существенно облегчить поиск необходимой информации в условиях конкретной рабочей ситуации, и продемонстрировать работу подобных программ. Одной из базовых переводческих технологий на сегодняшний день, помимо электронных словарей, является возможность предварительного машинного перевода текстов. Специалист может выбрать ту или иную систему автоматического перевода, с которой будет работать в дальнейшем. Соответственно прежде всего необходимо определиться с наиболее подходящей для работы системой машинного перевода. На сегодняшний день самыми известными и наиболее используемыми являются такие, как «Яндекс Переводчик», «Promt» и «Google Translate». «Promt» относится к категории систем, работающих на основе грамматических правил (Rule-Based Machine Translation, RBMT). Данная технология базируется на сопоставлении лексических единиц и грамматических правил конкретных языков. Качество такого перевода находится в прямой зависимости от объемов лингвистических баз данных (словарей) и глубины описания естественных языков [10; 12; 14]. К преимуществам RBMT-систем можно отнести синтаксическую точность и предсказуемость результата; такие системы можно настроить на предметную область. Основным недостатком является необходимость поддержания и постоянного обновления баз данных. «Яндекс Переводчик» и «Google Translate» относятся к статистическим системам МП (Statistical Machine Translation, SMT). Данная технология основана на поиске наиболее вероятного варианта перевода в двуязычных базах данных (корпусах). SMT имеет возможности «самообучения»: чем больше параллельных текстов и чем точнее они соответствуют друг другу, тем лучше результат перевода. В качестве преимуществ SMT-систем можно отметить гладкость перевода и переносимость технологии на любые языковые пары. Среди недостатков отмечают отсутствие корпусов у некоторых языков, неумение систем справляться с морфологией и синтаксисом, искажение информации [10; 12]. Более того, «Google Translate» находится в сильной позиции по отношению к другим системам, когда речь идет о переводе с/на английский, так как данный язык изначально лежал в основе системы и до сих пор является языкомпосредником при работе с другими парами языков. Суть эксперимента сводилась к следующему: студенты 3 курса в количестве 12 человек разделились на 3 группы по 4 человека; каждая из групп работала с одной из трех систем машинного перевода. У каждого студента была собственная статья на английском языке по теме, которую он сам выбрал для перевода (экономического, политического, технического и медицинского толка). Среднее количество знаков в статье (с пробелами) не превышало 4 тысяч (как правило, 3500—4000), а время выполнения задания ограничивалось одной парой (90 минут). Студентам предлагалось выполнить ПЕДАГОГИЧЕСКОЕ ОБРАЗОВАНИЕ В РОССИИ. 2019. No 1 57 постредактирование машинного перевода статей в соответствующей системе и ответить на вопросы. Ниже представлены наиболее интересные и полные ответы студентов по каждой из систем машинного перевода с примерами и пояснениями.