How we color the world with words

IF 0.2 0 LANGUAGE & LINGUISTICS
Kristina Kocijan
{"title":"How we color the world with words","authors":"Kristina Kocijan","doi":"10.22210/suvlin.2022.093.03","DOIUrl":null,"url":null,"abstract":"Th is paper presents a computational approach to the automatic detection of language patterns, specifi cally those dealing with expressing colors in the Croatian language. It investigates diff erent lexicalization patterns of color terms, mainly compounds and multiword units, in order to classify them and prepare them for usage in the design of an algorithm that will automatically recognize and annotate these expressions in Croatian text. Th e paper also presents a comparative analysis of diff erent classes of color terms found in a corpus built from books intended for younger (CLC) and older (ALC) populations. Finally, the research data is presented through a dictionary of three types of color terms categorized as multiword expressions. su unutar NooJ alata za obradu jezika gdje su omogućili izradu (a) digitalnog rječnika s popisom osnovnih boja i opisom njihovih derivacija te (b) računalnog algoritma za automatsko prepoznavanje i označavanje boja u hrvatskom jeziku i pripadajućih oznaka klase. dodatno predstavljena usporedna analiza različitih klasa izraza za boje pronađenih korpusu izgrađenom iz knjževnih namijenjenih mlađoj (CLC) starijoj (ALC) populaciji kako dobili dodatni uvidi o korištenju određenog obrasca ovisno o uzorku teksta kojim se radi analiza. Podaci istraživanja dani su i kroz tablični prikaz tri tipa izraza za boju u klasi višerječnih izraza. Pripremljeni resursi otvaraju mogućnost dodatnih analiza tekstova iz drugih domena i s novim istraživačkim interesima koji uključuju boje u računalnoj obradi jezika.","PeriodicalId":40950,"journal":{"name":"Suvremena Lingvistika","volume":" ","pages":""},"PeriodicalIF":0.2000,"publicationDate":"2022-07-25","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Suvremena Lingvistika","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.22210/suvlin.2022.093.03","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"0","JCRName":"LANGUAGE & LINGUISTICS","Score":null,"Total":0}
引用次数: 0

Abstract

Th is paper presents a computational approach to the automatic detection of language patterns, specifi cally those dealing with expressing colors in the Croatian language. It investigates diff erent lexicalization patterns of color terms, mainly compounds and multiword units, in order to classify them and prepare them for usage in the design of an algorithm that will automatically recognize and annotate these expressions in Croatian text. Th e paper also presents a comparative analysis of diff erent classes of color terms found in a corpus built from books intended for younger (CLC) and older (ALC) populations. Finally, the research data is presented through a dictionary of three types of color terms categorized as multiword expressions. su unutar NooJ alata za obradu jezika gdje su omogućili izradu (a) digitalnog rječnika s popisom osnovnih boja i opisom njihovih derivacija te (b) računalnog algoritma za automatsko prepoznavanje i označavanje boja u hrvatskom jeziku i pripadajućih oznaka klase. dodatno predstavljena usporedna analiza različitih klasa izraza za boje pronađenih korpusu izgrađenom iz knjževnih namijenjenih mlađoj (CLC) starijoj (ALC) populaciji kako dobili dodatni uvidi o korištenju određenog obrasca ovisno o uzorku teksta kojim se radi analiza. Podaci istraživanja dani su i kroz tablični prikaz tri tipa izraza za boju u klasi višerječnih izraza. Pripremljeni resursi otvaraju mogućnost dodatnih analiza tekstova iz drugih domena i s novim istraživačkim interesima koji uključuju boje u računalnoj obradi jezika.
我们如何用文字给世界上色
本文提出了一种自动检测语言模式的计算方法,特别是那些处理克罗地亚语中表达颜色的模式。它研究了颜色术语的不同词汇化模式,主要是复合词和多词单位,以便对它们进行分类,并准备在设计一种算法时使用,该算法将自动识别和注释克罗地亚文本中的这些表达。本文还比较分析了一个语料库中不同类别的颜色术语,该语料库是由面向年轻(CLC)和老年(ALC)人群的书籍组成的。最后,通过将三种类型的颜色术语分类为多词表达的字典呈现研究数据。su unutar NooJ alata za obradu jezika gdje su omogućili izradu (a) digitalnog rjek的popisom osnovnih boja i opisom njihovih derivacija (b) ra unalog算法za automatsko prepoznavanje i ozna avanje boja u hrvatskom jeziku pripadajućih oznaka klase。dodatno predstavljena usporedna analiziza razli with klasa izraza za boje pronađenih korpusu izgrađenom iz knjževnih纳米jenjenih mlađoj (CLC) stararijoj (ALC) populaciji kako dobili dodatni uvidi o korištenju određenog obrasca ovisno o uzorku teksta kojim se radii analiza。Podaci istraživanja dani su i kroz tablini prikaz tri tipa izraza za boju u klasi višerječnih izraza。Pripremljeni resursi otvaraju mogućnost dodatnih analysis tekstova iz drugih domena i ' s novim istraživačkim interesima koji ukljuuju boje u raunalnoj obradi jezika。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
Suvremena Lingvistika
Suvremena Lingvistika LANGUAGE & LINGUISTICS-
CiteScore
0.30
自引率
0.00%
发文量
8
审稿时长
17 weeks
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信