{"title":"Korpus \"Skandinavische Semikommunikation\" - ein mehrsprachiges Diskurskorpus auf XML-Basis","authors":"Thomas Schmidt","doi":"10.21248/jlcl.18.2003.47","DOIUrl":null,"url":null,"abstract":"Der Sonderforschungsbereich 538 „Mehrsprachigkeit“ an der Universität Hamburg vereinigt in seinen dreizehn Teilprojekten eine Vielzahl von Forschern, die sich unter verschiedenen Herangehensweisen mit dem Thema der Mehrsprachigkeit auseinandersetzen. Die weitaus größte Zahl der Projekte arbeitet dabei empirisch auf der Grundlage von Aufnahmen gesprochener Sprache, die durch eine computergestützte Transkription der Analyse zugänglich gemacht werden. Das Projekt „Datenbank Mehrsprachigkeit“ hat sich zum Ziel gesetzt, ein gemeinsames Dach für diese Transkriptionsdaten zu schaffen, unter dem es möglich sein soll, Transkriptionen zwischen einzelnen Teilprojekten auszutauschen oder Daten aus verschiedenen Projekten gemeinsam zu analysieren. Das in diesem Beitrag vorgestellte Korpus „Skandinavische Semikommunikation“ vereinigt die im Teilprojekt K5 „Semikommunikation und rezeptive Mehrsprachigkeit im heutigen Skandinavien“ erstellten Transkriptionsdaten und gilt als Testfall und Prototyp für die Datenbank Mehrsprachigkeit. Wie z.B. in Schmidt (2001, 2002a, 2002b, i.V.) dargestellt, fungiert dabei die XML-Anwendung EXMARaLDA als zentrale Architekturkomponente. Sie übernimmt erstens die Rolle einer Interlingua zwischen den vorhandenen älteren Datenformaten. Zweitens dient sie als Zielbzw. Ausgangsformat für mehrere Eingabeund Ausgabemethoden und bildet mit diesen zusammen ein eigenständiges System zur computergestützten Transkription. Drittens schließlich ist sie Grundlage der Datenbank Mehrsprachigkeit und der von ihr zur Verfügung zu stellenden Analyseinstrumente. Abbildung 1 auf der folgenden Seite veranschaulicht dies. Auch für das hier vorgestellte Korpus „Skandinavische Semikommunikation“ ist daher das EXMARaLDA-System von zentraler Bedeutung. Wie genau bei seiner Erstellung von den verschiedenen Eingabemethoden für Transkriptionsdaten Gebrauch gemacht wird, und welche Ausgabemethoden und Analysewerkzeuge auf die Daten angewandt werden können, wird im nächsten Abschnitt ausgeführt werden.","PeriodicalId":346957,"journal":{"name":"LDV Forum","volume":null,"pages":null},"PeriodicalIF":0.0000,"publicationDate":"2003-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"3","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"LDV Forum","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.21248/jlcl.18.2003.47","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 3
Abstract
Der Sonderforschungsbereich 538 „Mehrsprachigkeit“ an der Universität Hamburg vereinigt in seinen dreizehn Teilprojekten eine Vielzahl von Forschern, die sich unter verschiedenen Herangehensweisen mit dem Thema der Mehrsprachigkeit auseinandersetzen. Die weitaus größte Zahl der Projekte arbeitet dabei empirisch auf der Grundlage von Aufnahmen gesprochener Sprache, die durch eine computergestützte Transkription der Analyse zugänglich gemacht werden. Das Projekt „Datenbank Mehrsprachigkeit“ hat sich zum Ziel gesetzt, ein gemeinsames Dach für diese Transkriptionsdaten zu schaffen, unter dem es möglich sein soll, Transkriptionen zwischen einzelnen Teilprojekten auszutauschen oder Daten aus verschiedenen Projekten gemeinsam zu analysieren. Das in diesem Beitrag vorgestellte Korpus „Skandinavische Semikommunikation“ vereinigt die im Teilprojekt K5 „Semikommunikation und rezeptive Mehrsprachigkeit im heutigen Skandinavien“ erstellten Transkriptionsdaten und gilt als Testfall und Prototyp für die Datenbank Mehrsprachigkeit. Wie z.B. in Schmidt (2001, 2002a, 2002b, i.V.) dargestellt, fungiert dabei die XML-Anwendung EXMARaLDA als zentrale Architekturkomponente. Sie übernimmt erstens die Rolle einer Interlingua zwischen den vorhandenen älteren Datenformaten. Zweitens dient sie als Zielbzw. Ausgangsformat für mehrere Eingabeund Ausgabemethoden und bildet mit diesen zusammen ein eigenständiges System zur computergestützten Transkription. Drittens schließlich ist sie Grundlage der Datenbank Mehrsprachigkeit und der von ihr zur Verfügung zu stellenden Analyseinstrumente. Abbildung 1 auf der folgenden Seite veranschaulicht dies. Auch für das hier vorgestellte Korpus „Skandinavische Semikommunikation“ ist daher das EXMARaLDA-System von zentraler Bedeutung. Wie genau bei seiner Erstellung von den verschiedenen Eingabemethoden für Transkriptionsdaten Gebrauch gemacht wird, und welche Ausgabemethoden und Analysewerkzeuge auf die Daten angewandt werden können, wird im nächsten Abschnitt ausgeführt werden.