A construção de corpus de larga escala da fala bilíngue de crianças e da fala bilíngue dirigida à criança, anotado e alinhado aos arquivos de áudio: desafios, soluções e implicações para a pesquisa
Alex Lưu, Pasha Koval, Sophia A. Malamud, Irina Y. Dubinina
{"title":"A construção de corpus de larga escala da fala bilíngue de crianças e da fala bilíngue dirigida à criança, anotado e alinhado aos arquivos de áudio: desafios, soluções e implicações para a pesquisa","authors":"Alex Lưu, Pasha Koval, Sophia A. Malamud, Irina Y. Dubinina","doi":"10.1590/2176-4573p55831","DOIUrl":null,"url":null,"abstract":"RESUMO O projeto BiRCh (The Corpus of Bilingual Russian Child Speech, Corpus de fala de crianças bilíngues em russo) envolve a construção de um corpus longitudinal composto de gravações de fala em russo produzida por crianças e suas famílias na Rússia, Ucrânia, Alemanha, EUA e Canadá. Estamos construindo um corpus de larga escala com base no conjunto dessas gravações, o ‘Parsed and Audio-aligned Corpus of Bilingual Russian Child and Child-directed Speech (BiRCh)’, com os dois componentes básicos: (1) as transcrições de um milhão de palavras alinhadas com os arquivos de áudio, em que pode ser realizada a busca textual, e (2) as transcrições de 500 mil palavras anotadas morfologicamente e analisadas sintaticamente, também alinhadas com os arquivos de áudio. Estamos utilizando o corpus para investigar os diversos fenômenos no input linguístico e na trajetória do desenvolvimento de falantes de herança, tais como o uso de caso, gênero, construções passivas e impessoais, marcadores de polidez, disfluências e marcadores discursivos. Este artigo enfoca os desafios e soluções no processo da construção do BiRCh e as implicações para a pesquisa com base nos dados detalhadamente anotados fornecidos pelo corpus.","PeriodicalId":37906,"journal":{"name":"Bakhtiniana","volume":" ","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2022-10-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Bakhtiniana","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.1590/2176-4573p55831","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q2","JCRName":"Arts and Humanities","Score":null,"Total":0}
引用次数: 0
Abstract
RESUMO O projeto BiRCh (The Corpus of Bilingual Russian Child Speech, Corpus de fala de crianças bilíngues em russo) envolve a construção de um corpus longitudinal composto de gravações de fala em russo produzida por crianças e suas famílias na Rússia, Ucrânia, Alemanha, EUA e Canadá. Estamos construindo um corpus de larga escala com base no conjunto dessas gravações, o ‘Parsed and Audio-aligned Corpus of Bilingual Russian Child and Child-directed Speech (BiRCh)’, com os dois componentes básicos: (1) as transcrições de um milhão de palavras alinhadas com os arquivos de áudio, em que pode ser realizada a busca textual, e (2) as transcrições de 500 mil palavras anotadas morfologicamente e analisadas sintaticamente, também alinhadas com os arquivos de áudio. Estamos utilizando o corpus para investigar os diversos fenômenos no input linguístico e na trajetória do desenvolvimento de falantes de herança, tais como o uso de caso, gênero, construções passivas e impessoais, marcadores de polidez, disfluências e marcadores discursivos. Este artigo enfoca os desafios e soluções no processo da construção do BiRCh e as implicações para a pesquisa com base nos dados detalhadamente anotados fornecidos pelo corpus.
BakhtinianaArts and Humanities-Literature and Literary Theory
CiteScore
0.20
自引率
0.00%
发文量
69
审稿时长
12 weeks
期刊介绍:
Bakhtiniana. Revista de Estudos do Discurso[Bakhtiniana. Journal of Discourse Studies], in electronic format, was created in 2008 by Programa de Estudos Pós-Graduados em Linguística Aplicada e Estudos da Linguagem [the Applied Linguistics and Language Studies Graduate Program] of Pontifícia Universidade Católica de São Paulo/LAEL-PUCSP and by the members of Linguagem, identidade e memória [Language, Identity and Memory] Research Group/CNPq (National Council for Scientific and Technological Development). The journal''s mission is to promote and to publicize research on discourse, mainly on dialogic studies. From 2019 on, it will publish an issue every three months. Each issue is composed of papers and book reviews written by professors and Phd researchers from international and national universities. This is the only journal that covers Bakhtinian studiesper seand that dialogues with other areas of knowledge in Brazil and abroad.