{"title":"A magyar nyelv digitális támogatása a magyar tudományosság szolgálatában","authors":"G. Prószéky, Tamás Váradi, A. Holl","doi":"10.18349/magyarnyelv.2023.4.478","DOIUrl":null,"url":null,"abstract":"Az MTA Könyvtár és Információs Központ repozitóriuma (a REAL) a magyar nyelvű tudományos szakirodalom jelentős másodlagos (archivált) forrása. Míg a korábbiakban ez a gyűjtemény a hagyományos könyvtári funkcionalitásnak megfelelően egyedi kutatói dokumentumigényeket szolgált ki, a itt a dokumentumok szöveges rétegei szövegkorpuszként vannak kezelve. Nyelvtechnológiai eszközök alkalmazásával történik a korpusz feltárása és széles értelemben vett szövegbányászata, többek között szakirodalmi hivatkozások és különböző névkifejezések kigyűjtése. A projekt keretében megtörténik mind a szöveg, mind az esetleges szöveghibák javítása, mind a dokumentumok leíró adatainak gazdagítása (például a tudományterület automatikus meghatározása). A projekt célkitűzése a repozitóriumi szolgáltatások és adatminőség javítása, lehetővé téve értéknövelt szolgáltatások fejlesztését a kutatói közösség számára.","PeriodicalId":52530,"journal":{"name":"Magyar Nyelv","volume":"93 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2023-12-20","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Magyar Nyelv","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.18349/magyarnyelv.2023.4.478","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q4","JCRName":"Arts and Humanities","Score":null,"Total":0}
引用次数: 0
Abstract
Az MTA Könyvtár és Információs Központ repozitóriuma (a REAL) a magyar nyelvű tudományos szakirodalom jelentős másodlagos (archivált) forrása. Míg a korábbiakban ez a gyűjtemény a hagyományos könyvtári funkcionalitásnak megfelelően egyedi kutatói dokumentumigényeket szolgált ki, a itt a dokumentumok szöveges rétegei szövegkorpuszként vannak kezelve. Nyelvtechnológiai eszközök alkalmazásával történik a korpusz feltárása és széles értelemben vett szövegbányászata, többek között szakirodalmi hivatkozások és különböző névkifejezések kigyűjtése. A projekt keretében megtörténik mind a szöveg, mind az esetleges szöveghibák javítása, mind a dokumentumok leíró adatainak gazdagítása (például a tudományterület automatikus meghatározása). A projekt célkitűzése a repozitóriumi szolgáltatások és adatminőség javítása, lehetővé téve értéknövelt szolgáltatások fejlesztését a kutatói közösség számára.