{"title":"Automatizuotas arbitraliųjų kolokacijų atpažinimas: būdvardžių ir daiktavardžių kolokacijos","authors":"Jolanta Kovalevskaitė, Erika Rimkutė, Jurgita Vaičenonienė","doi":"10.5755/j01.sal.1.39.29193","DOIUrl":null,"url":null,"abstract":"Straipsnyje analizuojamas vienas kolokacijų tipas – arbitraliosios kolokacijos. Jos laikomos nemotyvuotomis (tuo skiriasi nuo kito kolokacijų tipo – trivialiųjų, arba motyvuotųjų, kolokacijų, pvz.: graži diena, naujas tyrimas), joms būdingas ribotas leksinis junglumas: pagal panašią reikšmę teoriškai galima rinktis daugiau negu vieną žodį, bet linkstama vartoti būtent kurį nors vieną, pvz., platus akiratis, bet ne didelis akiratis, stipri sveikata, bet ne galinga sveikata.\nAnalizuotos iš „Lietuvių kalbos pastoviųjų žodžių junginių duomenų bazės“ atrinktos visos kolokacijos, sudarytos iš būdvardžių ir daiktavardžių (apie 5000 junginių). Nustatyta, kad iš jų apie 650 yra arbitraliosios kolokacijos. Atrenkant šias kolokacijas, taikytas sinonimų pakeičiamumo testas: jeigu kolokacijos būdvardiškasis dėmuo (būdvardis ir būdvardiškai vartojamas dalyvis) nėra pakeičiamas kitu artimos reikšmės sinonimu, tokia kolokacija laikoma arbitraliąja. Šis arbitraliųjų kolokacijų atrankos procesas buvo automatizuotas: automatiškai atrenkant artimus būdvardžių sinonimus junginiuose su daiktavardžiais, pritaikytas žodžių vektorių modelis. Automatiškai būdvardžiai ir dalyviai sugrupuoti į maždaug 800 vektorių eilučių. Straipsnyje aprašyta, kaip vyko duomenų analizė, vertinimas ir tikslinimas, kokios kolokacijos ir kiek jų pripažintos arbitraliosiomis naudojant šį metodą.","PeriodicalId":37822,"journal":{"name":"Studies About Languages","volume":" ","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2021-11-27","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"1","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Studies About Languages","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5755/j01.sal.1.39.29193","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q2","JCRName":"Arts and Humanities","Score":null,"Total":0}
引用次数: 1
Abstract
Straipsnyje analizuojamas vienas kolokacijų tipas – arbitraliosios kolokacijos. Jos laikomos nemotyvuotomis (tuo skiriasi nuo kito kolokacijų tipo – trivialiųjų, arba motyvuotųjų, kolokacijų, pvz.: graži diena, naujas tyrimas), joms būdingas ribotas leksinis junglumas: pagal panašią reikšmę teoriškai galima rinktis daugiau negu vieną žodį, bet linkstama vartoti būtent kurį nors vieną, pvz., platus akiratis, bet ne didelis akiratis, stipri sveikata, bet ne galinga sveikata.
Analizuotos iš „Lietuvių kalbos pastoviųjų žodžių junginių duomenų bazės“ atrinktos visos kolokacijos, sudarytos iš būdvardžių ir daiktavardžių (apie 5000 junginių). Nustatyta, kad iš jų apie 650 yra arbitraliosios kolokacijos. Atrenkant šias kolokacijas, taikytas sinonimų pakeičiamumo testas: jeigu kolokacijos būdvardiškasis dėmuo (būdvardis ir būdvardiškai vartojamas dalyvis) nėra pakeičiamas kitu artimos reikšmės sinonimu, tokia kolokacija laikoma arbitraliąja. Šis arbitraliųjų kolokacijų atrankos procesas buvo automatizuotas: automatiškai atrenkant artimus būdvardžių sinonimus junginiuose su daiktavardžiais, pritaikytas žodžių vektorių modelis. Automatiškai būdvardžiai ir dalyviai sugrupuoti į maždaug 800 vektorių eilučių. Straipsnyje aprašyta, kaip vyko duomenų analizė, vertinimas ir tikslinimas, kokios kolokacijos ir kiek jų pripažintos arbitraliosiomis naudojant šį metodą.
期刊介绍:
The journal aims at bringing together the scholars interested in languages and technology, linguistic theory development, empirical research of different aspects of languages functioning within a society. The articles published in the journal focus on theoretical and empirical research, including General Linguistics, Applied Linguistics (Translation studies, Computational Linguistics, Sociolinguistics, Media Linguistics, etc.), Comparative and Contrastive Linguistics. The journal aims at becoming a multidisciplinary venue of sharing ideas and experience among the scholars working in the field.