{"title":"Izgradnja jezičnog korpusa govora mržnje na hrvatskom medijskom prostoru društvenih mreža","authors":"Slobodan Hadžić, Artur Šilić, Tanja Grmuša","doi":"10.22572/mi.28.2.3","DOIUrl":null,"url":null,"abstract":"Govor mržnje predstavlja neprihvatljiv oblik društveno štetnih komunikacijskih formi čija je raširenost u posljednje vrijeme u porastu. Razvojem digitalnih medija, a posebice jačanjem uloge društvenih mreža u privatnoj i javnoj komunikaciji, otvoren je prostor za brojne javne virtualne forume koji su pasivnu publiku potaknuli na aktivniju participaciju i komunikaciju. Sloboda govora i izražavanja kao temeljna demokratska načela s jedne strane suočavaju se s prostorom za toksičnu komunikaciju s druge strane, okupljajući istomišljenike u virtualnim zajednicama kojima su meta napada nerijetko akteri priloga, novinari, urednici, mediji, pa i drugi korisnici. Uzimajući u obzir neograničenost internetskog prostora čiji je sadržaj teško kontrolirati, postavlja se pitanje kako prepoznati društveno štetne komunikacijske forme u javnom prostoru, može li ih se spriječiti i kako zadržati postojeću publiku. Mogućnosti upotrebe proširuju se i na područje moderiranja neprimjerenih komentara korisnika oslanjanjem na softvere koji pružaju trenutne odgovore medijskim organizacijama, ali i koji također pokazuju kontinuiranu potrebu za samopoboljšanjima. Interes autora u ovom radu vezan je za detekciju govora mržnje prema etnicitetu na društvenim mrežama te istraživanju mogućnosti primjene jezičnih tehnologija u prepoznavanju i sprječavanju širenja govora mrženja. Kvantitativnom i kvalitativnom analizom sadržaja te primjenom niza softverskih rješenja temeljenih na jezičnim tehnologijama omogućena je učinkovita automatska i poluautomatska analiza velike količine korisnički generiranog sadržaja. Korišteni su: program WordFinder za brzi pronalazak riječi u velikim korpusima, alat CRONTIMENT za automatsku dodjelu sentimenta tekstovima na hrvatskom jeziku, aplikacija Text Marker za učinkovito ručno označavanje i izgradnju korpusa. U pojedinim studijama slučaja autori detektiraju promjene u vrstama i frekvencijama pojave govora mržnje u predmetu istraživanja te identificiraju glavne prednosti i nedostatke primjene jezičnih tehnologija, sugerirajući pri tome moguće smjerove razvoja.","PeriodicalId":35195,"journal":{"name":"Medijska Istrazivanja","volume":"1 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2022-12-23","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Medijska Istrazivanja","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.22572/mi.28.2.3","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q3","JCRName":"Social Sciences","Score":null,"Total":0}
引用次数: 0
Abstract
Govor mržnje predstavlja neprihvatljiv oblik društveno štetnih komunikacijskih formi čija je raširenost u posljednje vrijeme u porastu. Razvojem digitalnih medija, a posebice jačanjem uloge društvenih mreža u privatnoj i javnoj komunikaciji, otvoren je prostor za brojne javne virtualne forume koji su pasivnu publiku potaknuli na aktivniju participaciju i komunikaciju. Sloboda govora i izražavanja kao temeljna demokratska načela s jedne strane suočavaju se s prostorom za toksičnu komunikaciju s druge strane, okupljajući istomišljenike u virtualnim zajednicama kojima su meta napada nerijetko akteri priloga, novinari, urednici, mediji, pa i drugi korisnici. Uzimajući u obzir neograničenost internetskog prostora čiji je sadržaj teško kontrolirati, postavlja se pitanje kako prepoznati društveno štetne komunikacijske forme u javnom prostoru, može li ih se spriječiti i kako zadržati postojeću publiku. Mogućnosti upotrebe proširuju se i na područje moderiranja neprimjerenih komentara korisnika oslanjanjem na softvere koji pružaju trenutne odgovore medijskim organizacijama, ali i koji također pokazuju kontinuiranu potrebu za samopoboljšanjima. Interes autora u ovom radu vezan je za detekciju govora mržnje prema etnicitetu na društvenim mrežama te istraživanju mogućnosti primjene jezičnih tehnologija u prepoznavanju i sprječavanju širenja govora mrženja. Kvantitativnom i kvalitativnom analizom sadržaja te primjenom niza softverskih rješenja temeljenih na jezičnim tehnologijama omogućena je učinkovita automatska i poluautomatska analiza velike količine korisnički generiranog sadržaja. Korišteni su: program WordFinder za brzi pronalazak riječi u velikim korpusima, alat CRONTIMENT za automatsku dodjelu sentimenta tekstovima na hrvatskom jeziku, aplikacija Text Marker za učinkovito ručno označavanje i izgradnju korpusa. U pojedinim studijama slučaja autori detektiraju promjene u vrstama i frekvencijama pojave govora mržnje u predmetu istraživanja te identificiraju glavne prednosti i nedostatke primjene jezičnih tehnologija, sugerirajući pri tome moguće smjerove razvoja.
州长žnje predstavlja neprihvatljiv oblik društvenoštetnih komunikacijskih formičija je raširenost u posljednje vrijeme u porastu。在发展数字媒体方面,特别是通过加强社交网络在私人和公共交流中的作用,为一些公共虚拟论坛开辟了空间,鼓励被动受众积极参与和交流。言论和表达自由作为一项基本的民主原则,一方面,我面临着一个有毒的沟通领域,在虚拟社区中收集针对罕见的访问参与者、记者、编辑、媒体等的意见。鉴于内容难以控制的互联网区域的无限限制,问题是如何识别公共区域中的社会有害传播形式,如果公众能够预防和维护这些传播形式的话。使用的可能性也得到了扩展,以使用户基于软件的不当评论现代化,这些软件为媒体组织提供了当前的回应,但也表明了自我完善的持续需求。作者对这项工作的兴趣是检测社交网络上的种族仇恨言论,并探索使用语言技术识别和防止仇恨言论传播的可能性。内容的定量和定性分析以及基于语言技术的一系列软件解决方案的使用,能够对大量用户生成的内容进行有效的自动和半自动分析。WordFinder程序用于快速查找大型尸体中的单词,CRONTIMENT工具用于自动为克罗地亚语文本分配情感,文本标记应用程序用于有效的手动标记和健美。在一些研究中,作者在研究中发现了仇恨言论的种类和频率的变化,并确定了使用语言技术的主要优点和缺点,从而提出了可能的发展。