Ирина Аврамовна Котюрова, Георгий Романович Сафонов
{"title":"基于德语学习者语料库的语言错误纵向研究","authors":"Ирина Аврамовна Котюрова, Георгий Романович Сафонов","doi":"10.23951/2307-6127-2024-1-54-64","DOIUrl":null,"url":null,"abstract":"В эпоху цифровизации и активного распространения корпусных технологий в лингвистическом образовании специалисты в области лингводидактики постоянно открывают все новые возможности в работе с большими данными. Одним из относительно новых явлений в российском образовании является сбор корпусов ученических текстов на иностранном языке. Их возможности для лингводидактических исследований зависят прежде всего от продолжительности сбора данных и от разметки, которую содержит тот или иной корпус. В статье речь идет о корпусе немецко-язычных студенческих текстов Петрозаводского аннотированного корпуса текстов и лонгитюдном исследовании типов лингвистических ошибок, допускаемых студентами на всем протяжении изучения немецкого языка в течение 5 лет. Результатом исследования стала статистика по 90 классам ошибок, поделенных на семь основных групп, и динамика этой статистики на протяжении 5 лет обучения немецкому языку. Сравнение наиболее частотных ошибок на первом и пятом курсах показывает, что к темам, которые на протяжении всех годов обучения вызывают наибольшие проблемы у студентов, относятся выбор лексемы, орфография, пропуски, пунктуация и обратный порядок слов. Уходят к концу обучения в вузе проблемы с неопределенным артиклем, склонением прилагательных и существительных, образованием множественного числа и родом существительных, уступая место другим проблемам, таким как лишние элементы, логика, порядок слов в придаточных предложениях и стилистические ошибки.\n In the age of digitalization and the active spread of corpus technologies in linguistic education, linguodidactics specialists are constantly discovering new opportunities in working with big data. One relatively new phenomenon in Russian education is the collection of corpora of student texts in a foreign language. It’s possibilities for linguodidactical research depend primarily on the duration of the data collection and on the markup that corpus contains. The article focuses on the corpus of German-language student texts PACT (Petrozavodsk annotated corpus of texts) and longitudinal research of types of linguistic mistakes made by students throughout the study of the German language for 5 years. The result of the research is statistics for 90 classes of errors, divided into 7 major groups – grammar, vocabulary, orthography, punctuation, discourse, omissions and superfluous elements – and the dynamics of these statistics over the 5 years of German language study. Comparison of the most frequent errors made by 1st and 5th year students respectively shows that subjects causing the most problems for students during all years of study are lexeme selection, orthography, omissions in text, punctuation and reverse word order. At the end of study problems with indefinite articles, adjective and noun declension, formation of plural form and gender of nouns are giving way to other issues such as superfluous elements in text, logic, word order in subordinate sentences and stylistic errors.","PeriodicalId":437532,"journal":{"name":"Pedagogical Review","volume":"347 3","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2024-02-28","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Longitudinal studies of language errors based on a German-language learner corpus\",\"authors\":\"Ирина Аврамовна Котюрова, Георгий Романович Сафонов\",\"doi\":\"10.23951/2307-6127-2024-1-54-64\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"В эпоху цифровизации и активного распространения корпусных технологий в лингвистическом образовании специалисты в области лингводидактики постоянно открывают все новые возможности в работе с большими данными. Одним из относительно новых явлений в российском образовании является сбор корпусов ученических текстов на иностранном языке. Их возможности для лингводидактических исследований зависят прежде всего от продолжительности сбора данных и от разметки, которую содержит тот или иной корпус. В статье речь идет о корпусе немецко-язычных студенческих текстов Петрозаводского аннотированного корпуса текстов и лонгитюдном исследовании типов лингвистических ошибок, допускаемых студентами на всем протяжении изучения немецкого языка в течение 5 лет. Результатом исследования стала статистика по 90 классам ошибок, поделенных на семь основных групп, и динамика этой статистики на протяжении 5 лет обучения немецкому языку. Сравнение наиболее частотных ошибок на первом и пятом курсах показывает, что к темам, которые на протяжении всех годов обучения вызывают наибольшие проблемы у студентов, относятся выбор лексемы, орфография, пропуски, пунктуация и обратный порядок слов. Уходят к концу обучения в вузе проблемы с неопределенным артиклем, склонением прилагательных и существительных, образованием множественного числа и родом существительных, уступая место другим проблемам, таким как лишние элементы, логика, порядок слов в придаточных предложениях и стилистические ошибки.\\n In the age of digitalization and the active spread of corpus technologies in linguistic education, linguodidactics specialists are constantly discovering new opportunities in working with big data. One relatively new phenomenon in Russian education is the collection of corpora of student texts in a foreign language. It’s possibilities for linguodidactical research depend primarily on the duration of the data collection and on the markup that corpus contains. The article focuses on the corpus of German-language student texts PACT (Petrozavodsk annotated corpus of texts) and longitudinal research of types of linguistic mistakes made by students throughout the study of the German language for 5 years. The result of the research is statistics for 90 classes of errors, divided into 7 major groups – grammar, vocabulary, orthography, punctuation, discourse, omissions and superfluous elements – and the dynamics of these statistics over the 5 years of German language study. Comparison of the most frequent errors made by 1st and 5th year students respectively shows that subjects causing the most problems for students during all years of study are lexeme selection, orthography, omissions in text, punctuation and reverse word order. At the end of study problems with indefinite articles, adjective and noun declension, formation of plural form and gender of nouns are giving way to other issues such as superfluous elements in text, logic, word order in subordinate sentences and stylistic errors.\",\"PeriodicalId\":437532,\"journal\":{\"name\":\"Pedagogical Review\",\"volume\":\"347 3\",\"pages\":\"\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2024-02-28\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Pedagogical Review\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.23951/2307-6127-2024-1-54-64\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Pedagogical Review","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.23951/2307-6127-2024-1-54-64","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
Longitudinal studies of language errors based on a German-language learner corpus
В эпоху цифровизации и активного распространения корпусных технологий в лингвистическом образовании специалисты в области лингводидактики постоянно открывают все новые возможности в работе с большими данными. Одним из относительно новых явлений в российском образовании является сбор корпусов ученических текстов на иностранном языке. Их возможности для лингводидактических исследований зависят прежде всего от продолжительности сбора данных и от разметки, которую содержит тот или иной корпус. В статье речь идет о корпусе немецко-язычных студенческих текстов Петрозаводского аннотированного корпуса текстов и лонгитюдном исследовании типов лингвистических ошибок, допускаемых студентами на всем протяжении изучения немецкого языка в течение 5 лет. Результатом исследования стала статистика по 90 классам ошибок, поделенных на семь основных групп, и динамика этой статистики на протяжении 5 лет обучения немецкому языку. Сравнение наиболее частотных ошибок на первом и пятом курсах показывает, что к темам, которые на протяжении всех годов обучения вызывают наибольшие проблемы у студентов, относятся выбор лексемы, орфография, пропуски, пунктуация и обратный порядок слов. Уходят к концу обучения в вузе проблемы с неопределенным артиклем, склонением прилагательных и существительных, образованием множественного числа и родом существительных, уступая место другим проблемам, таким как лишние элементы, логика, порядок слов в придаточных предложениях и стилистические ошибки.
In the age of digitalization and the active spread of corpus technologies in linguistic education, linguodidactics specialists are constantly discovering new opportunities in working with big data. One relatively new phenomenon in Russian education is the collection of corpora of student texts in a foreign language. It’s possibilities for linguodidactical research depend primarily on the duration of the data collection and on the markup that corpus contains. The article focuses on the corpus of German-language student texts PACT (Petrozavodsk annotated corpus of texts) and longitudinal research of types of linguistic mistakes made by students throughout the study of the German language for 5 years. The result of the research is statistics for 90 classes of errors, divided into 7 major groups – grammar, vocabulary, orthography, punctuation, discourse, omissions and superfluous elements – and the dynamics of these statistics over the 5 years of German language study. Comparison of the most frequent errors made by 1st and 5th year students respectively shows that subjects causing the most problems for students during all years of study are lexeme selection, orthography, omissions in text, punctuation and reverse word order. At the end of study problems with indefinite articles, adjective and noun declension, formation of plural form and gender of nouns are giving way to other issues such as superfluous elements in text, logic, word order in subordinate sentences and stylistic errors.