A magyar nyelv digitális támogatása a magyar tudományosság szolgálatában

Q4 Arts and Humanities

Magyar Nyelv Pub Date : 2023-12-20 DOI:10.18349/magyarnyelv.2023.4.478

G. Prószéky, Tamás Váradi, A. Holl

引用次数: 0

Abstract

Az MTA Könyvtár és Információs Központ repozitóriuma (a REAL) a magyar nyelvű tudományos szakirodalom jelentős másodlagos (archivált) forrása. Míg a korábbiakban ez a gyűjtemény a hagyományos könyvtári funkcionalitásnak megfelelően egyedi kutatói dokumentumigényeket szolgált ki, a itt a dokumentumok szöveges rétegei szövegkorpuszként vannak kezelve. Nyelvtechnológiai eszközök alkalmazásával történik a korpusz feltárása és széles értelemben vett szövegbányászata, többek között szakirodalmi hivatkozások és különböző névkifejezések kigyűjtése. A projekt keretében megtörténik mind a szöveg, mind az esetleges szöveghibák javítása, mind a dokumentumok leíró adatainak gazdagítása (például a tudományterület automatikus meghatározása). A projekt célkitűzése a repozitóriumi szolgáltatások és adatminőség javítása, lehetővé téve értéknövelt szolgáltatások fejlesztését a kutatói közösség számára.

查看原文本刊更多论文

为匈牙利学术研究服务的匈牙利语数字支持

匈牙利科学院图书馆和信息中心（REAL）的文献库是匈牙利科学文献的重要二级（存档）来源。过去，该文献库按照传统的图书馆功能满足个别研究人员的文献需求，而在这里，文献的文本层被视为文本语料库。语言学工具用于从广义上探索和挖掘语料库，包括提取文献参考资料和各种名词。该项目将改进文本和可能出现的文本错误，并丰富文献的描述性数据（如学科的自动定义）。项目的目标是改进资源库服务和数据质量，为研究界开发增值服务。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊

Magyar Nyelv Arts and Humanities-Language and Linguistics

CiteScore

0.10

自引率

0.00%

发文量