Korpus šolskih besedil slovenskega jezika: zasnova in gradnja

Q3 Arts and Humanities
Nina Ledinek, Mateja Jemec Tomazin, Mitja Trojar, Andrej Perdih, Janoš Ježovnik, Miro Romih, T. Erjavec
{"title":"Korpus šolskih besedil slovenskega jezika: zasnova in gradnja","authors":"Nina Ledinek, Mateja Jemec Tomazin, Mitja Trojar, Andrej Perdih, Janoš Ježovnik, Miro Romih, T. Erjavec","doi":"10.3986/jz.28.1.07","DOIUrl":null,"url":null,"abstract":"V prispevku je predstavljen Korpus šolskih besedil slovenskega jezika, specializirani pisni korpus slovenščine v obsegu približno 1,8 milijona pojavnic. Korpus je bil zasnovan v okviru projekta Franček, Jezikovna svetovalnica za učitelje slovenščine in Šolski slovar slovenskega jezika, in sicer kot gradivska osnova za oblikovanje Šolskega slovarja slovenskega jezika, prvega znanstveno utemeljenega pedagoškega slovarja za slovenski jezik. Prispevek obravnava besedilnotipsko sestavo in obseg korpusa, osvetljuje tehnične postopke predpriprave besedil in njihovega jezikoslovnega označevanja ter predstavlja nabor korpusnih metapodatkov, hkrati pa pojasnjuje, v katerih formatih in pod katerimi licencami je Korpus šolskih besedil slovenskega jezika na voljo. Članek opozarja tudi na pravne vidike pridobivanja besedil.","PeriodicalId":38399,"journal":{"name":"Jezikoslovni Zapiski","volume":" ","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2022-09-27","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Jezikoslovni Zapiski","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.3986/jz.28.1.07","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q3","JCRName":"Arts and Humanities","Score":null,"Total":0}
引用次数: 0

Abstract

V prispevku je predstavljen Korpus šolskih besedil slovenskega jezika, specializirani pisni korpus slovenščine v obsegu približno 1,8 milijona pojavnic. Korpus je bil zasnovan v okviru projekta Franček, Jezikovna svetovalnica za učitelje slovenščine in Šolski slovar slovenskega jezika, in sicer kot gradivska osnova za oblikovanje Šolskega slovarja slovenskega jezika, prvega znanstveno utemeljenega pedagoškega slovarja za slovenski jezik. Prispevek obravnava besedilnotipsko sestavo in obseg korpusa, osvetljuje tehnične postopke predpriprave besedil in njihovega jezikoslovnega označevanja ter predstavlja nabor korpusnih metapodatkov, hkrati pa pojasnjuje, v katerih formatih in pod katerimi licencami je Korpus šolskih besedil slovenskega jezika na voljo. Članek opozarja tudi na pravne vidike pridobivanja besedil.
斯洛文尼亚语学校文本语料库的设计与构建
本文介绍了斯洛文尼亚语学校文本语料库,这是一个专门的斯洛文尼亚语书面语料库,约有180万次出现。该语料库是Franček项目、斯洛文尼亚教师语言咨询和斯洛文尼亚语学校词典的一部分,是创建斯洛文尼亚语学校字典的物质基础,这是第一本基于科学的斯洛文尼亚语教学词典。本文讨论了语料库的文本组成和范围,阐明了文本预准备的技术程序及其语言注释,并提出了一组语料库元数据,同时解释了斯洛文尼亚语学校文本语料库的可用格式和许可证。文章还提请注意获取文本的法律方面。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
Jezikoslovni Zapiski
Jezikoslovni Zapiski Arts and Humanities-Language and Linguistics
CiteScore
0.40
自引率
0.00%
发文量
13
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信