{"title":"How we color the world with words","authors":"Kristina Kocijan","doi":"10.22210/suvlin.2022.093.03","DOIUrl":null,"url":null,"abstract":"Th is paper presents a computational approach to the automatic detection of language patterns, specifi cally those dealing with expressing colors in the Croatian language. It investigates diff erent lexicalization patterns of color terms, mainly compounds and multiword units, in order to classify them and prepare them for usage in the design of an algorithm that will automatically recognize and annotate these expressions in Croatian text. Th e paper also presents a comparative analysis of diff erent classes of color terms found in a corpus built from books intended for younger (CLC) and older (ALC) populations. Finally, the research data is presented through a dictionary of three types of color terms categorized as multiword expressions. su unutar NooJ alata za obradu jezika gdje su omogućili izradu (a) digitalnog rječnika s popisom osnovnih boja i opisom njihovih derivacija te (b) računalnog algoritma za automatsko prepoznavanje i označavanje boja u hrvatskom jeziku i pripadajućih oznaka klase. dodatno predstavljena usporedna analiza različitih klasa izraza za boje pronađenih korpusu izgrađenom iz knjževnih namijenjenih mlađoj (CLC) starijoj (ALC) populaciji kako dobili dodatni uvidi o korištenju određenog obrasca ovisno o uzorku teksta kojim se radi analiza. Podaci istraživanja dani su i kroz tablični prikaz tri tipa izraza za boju u klasi višerječnih izraza. Pripremljeni resursi otvaraju mogućnost dodatnih analiza tekstova iz drugih domena i s novim istraživačkim interesima koji uključuju boje u računalnoj obradi jezika.","PeriodicalId":40950,"journal":{"name":"Suvremena Lingvistika","volume":" ","pages":""},"PeriodicalIF":0.2000,"publicationDate":"2022-07-25","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Suvremena Lingvistika","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.22210/suvlin.2022.093.03","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"0","JCRName":"LANGUAGE & LINGUISTICS","Score":null,"Total":0}
引用次数: 0
Abstract
Th is paper presents a computational approach to the automatic detection of language patterns, specifi cally those dealing with expressing colors in the Croatian language. It investigates diff erent lexicalization patterns of color terms, mainly compounds and multiword units, in order to classify them and prepare them for usage in the design of an algorithm that will automatically recognize and annotate these expressions in Croatian text. Th e paper also presents a comparative analysis of diff erent classes of color terms found in a corpus built from books intended for younger (CLC) and older (ALC) populations. Finally, the research data is presented through a dictionary of three types of color terms categorized as multiword expressions. su unutar NooJ alata za obradu jezika gdje su omogućili izradu (a) digitalnog rječnika s popisom osnovnih boja i opisom njihovih derivacija te (b) računalnog algoritma za automatsko prepoznavanje i označavanje boja u hrvatskom jeziku i pripadajućih oznaka klase. dodatno predstavljena usporedna analiza različitih klasa izraza za boje pronađenih korpusu izgrađenom iz knjževnih namijenjenih mlađoj (CLC) starijoj (ALC) populaciji kako dobili dodatni uvidi o korištenju određenog obrasca ovisno o uzorku teksta kojim se radi analiza. Podaci istraživanja dani su i kroz tablični prikaz tri tipa izraza za boju u klasi višerječnih izraza. Pripremljeni resursi otvaraju mogućnost dodatnih analiza tekstova iz drugih domena i s novim istraživačkim interesima koji uključuju boje u računalnoj obradi jezika.
本文提出了一种自动检测语言模式的计算方法,特别是那些处理克罗地亚语中表达颜色的模式。它研究了颜色术语的不同词汇化模式,主要是复合词和多词单位,以便对它们进行分类,并准备在设计一种算法时使用,该算法将自动识别和注释克罗地亚文本中的这些表达。本文还比较分析了一个语料库中不同类别的颜色术语,该语料库是由面向年轻(CLC)和老年(ALC)人群的书籍组成的。最后,通过将三种类型的颜色术语分类为多词表达的字典呈现研究数据。su unutar NooJ alata za obradu jezika gdje su omogućili izradu (a) digitalnog rjek的popisom osnovnih boja i opisom njihovih derivacija (b) ra unalog算法za automatsko prepoznavanje i ozna avanje boja u hrvatskom jeziku pripadajućih oznaka klase。dodatno predstavljena usporedna analiziza razli with klasa izraza za boje pronađenih korpusu izgrađenom iz knjževnih纳米jenjenih mlađoj (CLC) stararijoj (ALC) populaciji kako dobili dodatni uvidi o korištenju određenog obrasca ovisno o uzorku teksta kojim se radii analiza。Podaci istraživanja dani su i kroz tablini prikaz tri tipa izraza za boju u klasi višerječnih izraza。Pripremljeni resursi otvaraju mogućnost dodatnih analysis tekstova iz drugih domena i ' s novim istraživačkim interesima koji ukljuuju boje u raunalnoj obradi jezika。