{"title":"Korpus Polsko-Niemiecki Uniwersytetu Warszawskiego i Uniwersytetu Gutenberga (PolGerCorp)","authors":"Marek Łaziński, Andreas Meger, M. Woźniak","doi":"10.7311/tid.16.2022.18","DOIUrl":null,"url":null,"abstract":"Celem artykułu jest prezentacja nowego korpusu polsko-niemieckiego PolGerCorp, zgromadzonego w latach 2018-2021 w ramach projektu Uniwersytetu Warszawskiego i Uniwersytetu Gutenberga w Moguncji. Korpus ma wielkość 10 mln słów w tekstach z lat 1750–2020. Teksty oryginalne polskie oraz niemieckie wraz z tłumaczeniami reprezentują prozę artystyczną, non-fiction, prasę i teksty prawne. Teksty zostały otagowane, zlematyzowane i wyrównane zdanie do zdania. W artykule prezentujemy interfejs przyjazny dla użytkownika niespecjalisty oraz możliwości wyszukiwania. Tagowanie odpowiedników aspektowych daje szczególną i unikalną szansę wyszukiwania w ramach par aspektowych z uwzględnieniem różnych formalnych typów wyznaczników aspektu.","PeriodicalId":221855,"journal":{"name":"tekst i dyskurs - text und diskurs","volume":"20 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2022-12-15","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"1","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"tekst i dyskurs - text und diskurs","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.7311/tid.16.2022.18","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 1
Abstract
Celem artykułu jest prezentacja nowego korpusu polsko-niemieckiego PolGerCorp, zgromadzonego w latach 2018-2021 w ramach projektu Uniwersytetu Warszawskiego i Uniwersytetu Gutenberga w Moguncji. Korpus ma wielkość 10 mln słów w tekstach z lat 1750–2020. Teksty oryginalne polskie oraz niemieckie wraz z tłumaczeniami reprezentują prozę artystyczną, non-fiction, prasę i teksty prawne. Teksty zostały otagowane, zlematyzowane i wyrównane zdanie do zdania. W artykule prezentujemy interfejs przyjazny dla użytkownika niespecjalisty oraz możliwości wyszukiwania. Tagowanie odpowiedników aspektowych daje szczególną i unikalną szansę wyszukiwania w ramach par aspektowych z uwzględnieniem różnych formalnych typów wyznaczników aspektu.