{"title":"IBK- und Social Media-Korpora am Leibniz-Institut für Deutsche Sprache","authors":"H. Lüngen, M. Kupietz","doi":"10.1515/9783110679885-016","DOIUrl":"https://doi.org/10.1515/9783110679885-016","url":null,"abstract":"Der Beitrag untersucht vorhandene Lösungen und neue Möglichkeiten des Korpusausbaus aus Social Mediaund internetbasierter Kommunikation (IBK) für das Deutsche Referenzkorpus (DeReKo). DeReKo ist eine Sammlung gegenwartssprachlicher Schriftkorpora am IDS, die der sprachwissenschaftlichen Öffentlichkeit über die Korpusschnittstellen COSMAS II und KorAP angeboten wird. Anhand von Definitionen und Beispielen gehen wir zunächst auf die Extensionen und Überlappungen der Konzepte Social Media, Internetbasierte Kommunikation und Computer-mediated Communication ein. Wir betrachten die rechtlichen Voraussetzungen für einen Korpusausbau aus Sozialen Medien, die sich aus dem kürzlich in relevanten Punkten reformierten deutschen Urheberrecht, aus Persönlichkeitsrechten wie der europäischen Datenschutz-Grundverordnung ergeben und stellen Konsequenzen sowie mögliche und tatsächliche Umsetzungen dar. Der Aufbau von Social Media-Korpora in großen Textmengen unterliegt außerdem korpustechnologischen Herausforderungen, die für traditionelle Schriftkorpora als gelöst galten oder gar nicht erst bestanden. Wir berichten, wie Fragen der Datenaufbereitung, des Korpus-Encoding, der Anonymisierung oder der linguistischen Annotation von Social Media-Korpora für DeReko angegangen wurden und welche Herausforderungen noch bestehen. Wir betrachten die Korpuslandschaft verfügbarer deutschsprachiger IBKund Social Media-Korpora und geben einen Überblick über den Bestand an IBKund Social Media-Korpora und ihre Charakteristika (Chat-, Wiki Talkund Forenkorpora) in DeReKo sowie von laufenden Projekten in diesem Bereich. Anhand korpuslinguistischer Mikround Makro-Analysen von Wikipedia-Diskussionen im Vergleich mit dem Gesamtbestand von DeReKo zeigen wir charakterisierende sprachliche Eigenschaften von Wikipedia-Diskussionen auf und bewerten ihren Status als Repräsentant von IBK-Korpora. 1 Einleitung: Definitionen Die drei Konzepte Social Media, Internetbasierte Kommunikation und Computermediated Communication werden in der Forschung auf den ersten Blick nebeneinander scheinbar für ein und dasselbe Kommunikationsgenre verwendet. Auch auf der Jahrestagung des Leibniz-Instituts für Deutsche Sprache (IDS) 2019 werden https://doi.org/10.1515/9783110679885-016 Erschienen in: Marx, Konstanze/Lobin, Henning/Schmidt, Axel (Hrsg.): Deutsch in Sozialen Medien: Interaktiv – multimodal – vielfältig. Berlin/Boston: de Gruyter, 2020. S. 319-342. (Jahrbuch des Leibniz-Instituts für Deutsche Sprache 2019) DOI: https://doi.org/10.1515/9783110679885-016 320 Harald Lüngen/Marc Kupietz alle drei Begriffe gebraucht, wobei einzelne Forscher oder Forscherinnen in der Regel einen von ihnen primär verwenden. Inwieweit stimmen die drei Konzepte genau überein, und worin unterscheiden sie sich möglicherweise? Im Social Media Guide for Researchers definieren Cann/Dimitriou/Hooley (2011) Social Media als „Internet services where the online content is generated by the users of the service“. Im Erläuterungstext w","PeriodicalId":360047,"journal":{"name":"Deutsch in Sozialen Medien","volume":"11 18 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2020-02-24","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"125763788","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
{"title":"Die Webkorpora im DWDS – Strategien des Korpusaufbaus und Nutzungsmöglichkeiten","authors":"A. Barbaresi, Alexander Geyken","doi":"10.1515/9783110679885-017","DOIUrl":"https://doi.org/10.1515/9783110679885-017","url":null,"abstract":"HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.","PeriodicalId":360047,"journal":{"name":"Deutsch in Sozialen Medien","volume":"154 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2020-02-24","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"127339929","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}