Sustainable long-term WordNet development and maintenance: Case study of the Czech WordNet

IF 0.4 0 LANGUAGE & LINGUISTICS
A. Rambousek, A. Horák, K. Pala
{"title":"Sustainable long-term WordNet development and maintenance: Case study of the Czech WordNet","authors":"A. Rambousek, A. Horák, K. Pala","doi":"10.11649/CS.1715","DOIUrl":null,"url":null,"abstract":"Sustainable long-term WordNet development and maintenance: Case study of the Czech WordNetCzech WordNet represents one of the first national wordnets created during the EuroWordNet and BalkaNet projects. However, the data contains various issues that affect the use of Czech WordNet in NLP applications. Since the publication of the first CzWN version, the semantic network was augmented in several phases, however, complex final editing and publishing process has not been finished. In 2017, we have started a project to evaluate and update the Czech WordNet, followed by a connection to the Collaborative Interlingual Index. In this paper, we provide an overview of Czech WordNet data updates and extensions, and present the roadmap to publish a revised version of the Czech WordNet under open license. Moreover, we introduce a developed concept for long-term updates and maintenance of the data based on crowdsourcing activities. Zrównoważony i długafalowy proces rozwoju i utrzymania wordnetu na przykładzie wordnetu czeskiegoCzeski WordNet jest jednym z pierwszych narodowych wordnetów powstałych podczas projektów EuroWordNet i BalkaNet. Jednakże dane zawierają błędy, które wpływają na używanie czeskiego wordnetu w aplikacjach NLP. Od momentu opublikowania pierwszej wersji czeskiego wordnetu sieć semantyczna została rozszerzona w kilku etapach, jednak złożony proces końcowej edycji i publikacji nie został jeszcze zakończony. W roku 2017 zaczęliśmy projekt mający na celu ocenę i aktualizację czeskiego wordnetu, a następnie połączenie go z Collaborative Interlingual Index. W danym artykule przedstawiamy ogólny zarys uaktualnień i rozszerzeń zawartości czeskiego wordnetu, a także prezentujemy plan działania, który doprowadzi do publikacji udoskonalonej wersji czeskiego wordnetu na otwartej licencji. Ponadto prezentujemy opracowaną koncepcję długoterminowych uaktualnień i utrzymania danych w oparciu o działania crowdsourcingowe.","PeriodicalId":52084,"journal":{"name":"Cognitive Studies-Etudes Cognitives","volume":"1 1","pages":""},"PeriodicalIF":0.4000,"publicationDate":"2018-12-20","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"3","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Cognitive Studies-Etudes Cognitives","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.11649/CS.1715","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"0","JCRName":"LANGUAGE & LINGUISTICS","Score":null,"Total":0}
引用次数: 3

Abstract

Sustainable long-term WordNet development and maintenance: Case study of the Czech WordNetCzech WordNet represents one of the first national wordnets created during the EuroWordNet and BalkaNet projects. However, the data contains various issues that affect the use of Czech WordNet in NLP applications. Since the publication of the first CzWN version, the semantic network was augmented in several phases, however, complex final editing and publishing process has not been finished. In 2017, we have started a project to evaluate and update the Czech WordNet, followed by a connection to the Collaborative Interlingual Index. In this paper, we provide an overview of Czech WordNet data updates and extensions, and present the roadmap to publish a revised version of the Czech WordNet under open license. Moreover, we introduce a developed concept for long-term updates and maintenance of the data based on crowdsourcing activities. Zrównoważony i długafalowy proces rozwoju i utrzymania wordnetu na przykładzie wordnetu czeskiegoCzeski WordNet jest jednym z pierwszych narodowych wordnetów powstałych podczas projektów EuroWordNet i BalkaNet. Jednakże dane zawierają błędy, które wpływają na używanie czeskiego wordnetu w aplikacjach NLP. Od momentu opublikowania pierwszej wersji czeskiego wordnetu sieć semantyczna została rozszerzona w kilku etapach, jednak złożony proces końcowej edycji i publikacji nie został jeszcze zakończony. W roku 2017 zaczęliśmy projekt mający na celu ocenę i aktualizację czeskiego wordnetu, a następnie połączenie go z Collaborative Interlingual Index. W danym artykule przedstawiamy ogólny zarys uaktualnień i rozszerzeń zawartości czeskiego wordnetu, a także prezentujemy plan działania, który doprowadzi do publikacji udoskonalonej wersji czeskiego wordnetu na otwartej licencji. Ponadto prezentujemy opracowaną koncepcję długoterminowych uaktualnień i utrzymania danych w oparciu o działania crowdsourcingowe.
可持续的长期WordNet开发和维护:捷克WordNet的案例研究
WordNet的可持续长期开发和维护:捷克WordNet的案例研究捷克WordNet是在EuroWordNet和BalkanNet项目期间创建的首批国家WordNet之一。然而,这些数据包含了影响在NLP应用程序中使用捷克语WordNet的各种问题。自第一个CzWN版本发布以来,语义网络在几个阶段得到了扩展,但复杂的最终编辑和发布过程尚未完成。2017年,我们启动了一个评估和更新捷克语网的项目,随后连接了协作语言间索引。在本文中,我们概述了捷克WordNet的数据更新和扩展,并提出了在开放许可证下发布捷克WordNet修订版的路线图。此外,我们引入了一个基于众包活动的数据长期更新和维护的概念。以捷克vordnet为例,vordnet的可持续和长期开发和维护过程捷克WordNet是在EuroWordNet和BalkanNet项目期间创建的首批国家级vordnet之一。然而,数据中存在错误,影响了捷克语wordnet在NLP应用程序中的使用。自捷克语网第一版出版以来,语义网络已分几个阶段进行了扩展,但最终编辑和出版的复杂过程尚未完成。2017年,我们启动了一个项目,旨在评估和更新捷克语网,然后将其与协作语言间索引相结合。在这篇文章中,我们介绍了捷克文字网内容的更新和扩展的概述,以及一项行动计划,该计划将导致在开放许可下发布捷克文字网的改进版本。此外,我们还提出了基于众包活动的长期更新和数据维护的概念。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
Cognitive Studies-Etudes Cognitives
Cognitive Studies-Etudes Cognitives LANGUAGE & LINGUISTICS-
CiteScore
1.10
自引率
83.30%
发文量
0
审稿时长
48 weeks
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信