Sintaksinio sudėtingumo analizė anotuotame lietuvių kalbos tekstyne priklausomybių nuotolio metodu

Q2 Arts and Humanities
Vytautas Ožeraitis
{"title":"Sintaksinio sudėtingumo analizė anotuotame lietuvių kalbos tekstyne priklausomybių nuotolio metodu","authors":"Vytautas Ožeraitis","doi":"10.5755/j01.sal.1.39.29258","DOIUrl":null,"url":null,"abstract":"Sintaksinis sudėtingumas yra visoms kalboms būdinga ypatybė, labai bendrai apibūdinama kaip sakinio (ar teksto) ir jo elementų įmantrumą, detalumą, sąrangą bei jungimosi modelius sudėtingumo aspektu pateikiantis įvertis. Lietuvių kalboje sintaksinis sudėtingumas nėra plačiai analizuotas. Sintaksinio sudėtingumo tyrimus apsunkina nenusistovėjusi termino apibrėžtis ir skirtingų jo apskaičiavimo metodų gausa. Šiame straipsnyje pristatomas sintaksinio sudėtingumo tyrimas sintaksiškai anotuotame lietuvių kalbos tekstyne ALKSNIS, naudojant sintaksinės priklausomybės nuotolio metodą, paremtą Dependency Locality teorija. Straipsnyje aprašoma sintaksinio sudėtingumo samprata, pristatomi sintaksinio sudėtingumo tyrimų principai, jų aktualumas ir pritaikomumas, pristatomi ir aptariami sintaksinio sudėtingumo rezultatai tekstyne, analizuojami pasirinkto metodo privalumai ir trūkumai. Šiuo tyrimu siekiama papildyti lietuvių kalbos sintaksinio sudėtingumo analizės lauką.\nSintaksinio sudėtingumo analizei naudojami du rodmenys – vidutinis priklausomybės nuotolis ir modifikuotas vidutinis priklausomybės nuotolis, sintaksiškai anotuotame tekstyne apskaičiuojant sintaksinių sakinio priklausomybės ryšių distanciją. Tyrime analizuojami visi tekstyno sakiniai, nustatomas atskirų tekstų ir tekstyno dalių sintaksinis sudėtingumas. Detaliau analizuojant paskirus sakinius, išryškėja tiek šių metodų trūkumai sintaksinio sudėtingumo analizei, tiek jų priklausomybė nuo tikslios ir nuoseklios anotavimo schemos. Analizuojant duomenis išryškėja poreikis į sintaksinio sudėtingumo sampratą bei formulę įtraukti sakinių tarpusavio sąsajų svertus. Nustatyta, kad modifikuoto vidutinio priklausomybės nuotolio formulėje įtraukta sakinio viršūnės pozicija galimai iškreipia rezultatus, todėl šią formulę reikėtų toliau tikslinti. Tyrimo metu nustatytos sakinių ir tekstų sudėtingumo ribos laikomos tik orientacinėmis, tiksliau joms apibrėžti siūlomi papildomi kokybiniai tyrimai ir eksperimentai.","PeriodicalId":37822,"journal":{"name":"Studies About Languages","volume":" ","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2021-11-27","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Studies About Languages","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5755/j01.sal.1.39.29258","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q2","JCRName":"Arts and Humanities","Score":null,"Total":0}
引用次数: 0

Abstract

Sintaksinis sudėtingumas yra visoms kalboms būdinga ypatybė, labai bendrai apibūdinama kaip sakinio (ar teksto) ir jo elementų įmantrumą, detalumą, sąrangą bei jungimosi modelius sudėtingumo aspektu pateikiantis įvertis. Lietuvių kalboje sintaksinis sudėtingumas nėra plačiai analizuotas. Sintaksinio sudėtingumo tyrimus apsunkina nenusistovėjusi termino apibrėžtis ir skirtingų jo apskaičiavimo metodų gausa. Šiame straipsnyje pristatomas sintaksinio sudėtingumo tyrimas sintaksiškai anotuotame lietuvių kalbos tekstyne ALKSNIS, naudojant sintaksinės priklausomybės nuotolio metodą, paremtą Dependency Locality teorija. Straipsnyje aprašoma sintaksinio sudėtingumo samprata, pristatomi sintaksinio sudėtingumo tyrimų principai, jų aktualumas ir pritaikomumas, pristatomi ir aptariami sintaksinio sudėtingumo rezultatai tekstyne, analizuojami pasirinkto metodo privalumai ir trūkumai. Šiuo tyrimu siekiama papildyti lietuvių kalbos sintaksinio sudėtingumo analizės lauką. Sintaksinio sudėtingumo analizei naudojami du rodmenys – vidutinis priklausomybės nuotolis ir modifikuotas vidutinis priklausomybės nuotolis, sintaksiškai anotuotame tekstyne apskaičiuojant sintaksinių sakinio priklausomybės ryšių distanciją. Tyrime analizuojami visi tekstyno sakiniai, nustatomas atskirų tekstų ir tekstyno dalių sintaksinis sudėtingumas. Detaliau analizuojant paskirus sakinius, išryškėja tiek šių metodų trūkumai sintaksinio sudėtingumo analizei, tiek jų priklausomybė nuo tikslios ir nuoseklios anotavimo schemos. Analizuojant duomenis išryškėja poreikis į sintaksinio sudėtingumo sampratą bei formulę įtraukti sakinių tarpusavio sąsajų svertus. Nustatyta, kad modifikuoto vidutinio priklausomybės nuotolio formulėje įtraukta sakinio viršūnės pozicija galimai iškreipia rezultatus, todėl šią formulę reikėtų toliau tikslinti. Tyrimo metu nustatytos sakinių ir tekstų sudėtingumo ribos laikomos tik orientacinėmis, tiksliau joms apibrėžti siūlomi papildomi kokybiniai tyrimai ir eksperimentai.
用距离依赖性分析立陶宛语注释文本中的句法复杂性
语法复杂性是所有语言的特征,通常被描述为对句子(或文本)及其元素复杂性的评估。在立陶宛语中,语法复杂性尚未得到广泛分析。语法复杂性研究由于术语的定义不稳定以及计算方法的多样性而变得复杂。本文采用基于依赖-局部性理论的句法依赖距离法,对立陶宛语带句法注释文本ALKSNIS进行了句法复杂性研究。本文阐述了句法复杂性的概念,介绍了句法复杂性研究的原则及其相关性和适用性,介绍并讨论了句法复杂性在文本中的结果,分析了所选方法的优缺点。本研究的目的是补充立陶宛语语法复杂性分析领域。语法复杂性分析使用两个参数:平均依赖距离和修正平均依赖距离,在语法注释文本中计算语法句子的依赖距离。该研究分析了所有具有结构的句子,确定了单个文本和部分结构的句法复杂性。对所分配句子的详细分析突出了在分析这些方法的语法复杂性方面的不足,以及它们对准确一致的发音方案的依赖。对数据的分析强调了将句子界面的权重纳入语法复杂性和公式概念的必要性。研究发现,修正后的平均依赖距离公式中句子顶部的位置可能会扭曲结果,因此应进一步修正该公式。研究中对句子和文本复杂性的限制应被视为只是指示性的,并建议进行更多的定性研究和实验来更准确地定义它们。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
Studies About Languages
Studies About Languages Social Sciences-Linguistics and Language
CiteScore
0.60
自引率
0.00%
发文量
8
审稿时长
32 weeks
期刊介绍: The journal aims at bringing together the scholars interested in languages and technology, linguistic theory development, empirical research of different aspects of languages functioning within a society. The articles published in the journal focus on theoretical and empirical research, including General Linguistics, Applied Linguistics (Translation studies, Computational Linguistics, Sociolinguistics, Media Linguistics, etc.), Comparative and Contrastive Linguistics. The journal aims at becoming a multidisciplinary venue of sharing ideas and experience among the scholars working in the field.
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信