Korpus "Skandinavische Semikommunikation" - ein mehrsprachiges Diskurskorpus auf XML-Basis

LDV Forum Pub Date : 2003-07-01 DOI:10.21248/jlcl.18.2003.47
Thomas Schmidt
{"title":"Korpus \"Skandinavische Semikommunikation\" - ein mehrsprachiges Diskurskorpus auf XML-Basis","authors":"Thomas Schmidt","doi":"10.21248/jlcl.18.2003.47","DOIUrl":null,"url":null,"abstract":"Der Sonderforschungsbereich 538 „Mehrsprachigkeit“ an der Universität Hamburg vereinigt in seinen dreizehn Teilprojekten eine Vielzahl von Forschern, die sich unter verschiedenen Herangehensweisen mit dem Thema der Mehrsprachigkeit auseinandersetzen. Die weitaus größte Zahl der Projekte arbeitet dabei empirisch auf der Grundlage von Aufnahmen gesprochener Sprache, die durch eine computergestützte Transkription der Analyse zugänglich gemacht werden. Das Projekt „Datenbank Mehrsprachigkeit“ hat sich zum Ziel gesetzt, ein gemeinsames Dach für diese Transkriptionsdaten zu schaffen, unter dem es möglich sein soll, Transkriptionen zwischen einzelnen Teilprojekten auszutauschen oder Daten aus verschiedenen Projekten gemeinsam zu analysieren. Das in diesem Beitrag vorgestellte Korpus „Skandinavische Semikommunikation“ vereinigt die im Teilprojekt K5 „Semikommunikation und rezeptive Mehrsprachigkeit im heutigen Skandinavien“ erstellten Transkriptionsdaten und gilt als Testfall und Prototyp für die Datenbank Mehrsprachigkeit. Wie z.B. in Schmidt (2001, 2002a, 2002b, i.V.) dargestellt, fungiert dabei die XML-Anwendung EXMARaLDA als zentrale Architekturkomponente. Sie übernimmt erstens die Rolle einer Interlingua zwischen den vorhandenen älteren Datenformaten. Zweitens dient sie als Zielbzw. Ausgangsformat für mehrere Eingabeund Ausgabemethoden und bildet mit diesen zusammen ein eigenständiges System zur computergestützten Transkription. Drittens schließlich ist sie Grundlage der Datenbank Mehrsprachigkeit und der von ihr zur Verfügung zu stellenden Analyseinstrumente. Abbildung 1 auf der folgenden Seite veranschaulicht dies. Auch für das hier vorgestellte Korpus „Skandinavische Semikommunikation“ ist daher das EXMARaLDA-System von zentraler Bedeutung. Wie genau bei seiner Erstellung von den verschiedenen Eingabemethoden für Transkriptionsdaten Gebrauch gemacht wird, und welche Ausgabemethoden und Analysewerkzeuge auf die Daten angewandt werden können, wird im nächsten Abschnitt ausgeführt werden.","PeriodicalId":346957,"journal":{"name":"LDV Forum","volume":null,"pages":null},"PeriodicalIF":0.0000,"publicationDate":"2003-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"3","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"LDV Forum","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.21248/jlcl.18.2003.47","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 3

Abstract

Der Sonderforschungsbereich 538 „Mehrsprachigkeit“ an der Universität Hamburg vereinigt in seinen dreizehn Teilprojekten eine Vielzahl von Forschern, die sich unter verschiedenen Herangehensweisen mit dem Thema der Mehrsprachigkeit auseinandersetzen. Die weitaus größte Zahl der Projekte arbeitet dabei empirisch auf der Grundlage von Aufnahmen gesprochener Sprache, die durch eine computergestützte Transkription der Analyse zugänglich gemacht werden. Das Projekt „Datenbank Mehrsprachigkeit“ hat sich zum Ziel gesetzt, ein gemeinsames Dach für diese Transkriptionsdaten zu schaffen, unter dem es möglich sein soll, Transkriptionen zwischen einzelnen Teilprojekten auszutauschen oder Daten aus verschiedenen Projekten gemeinsam zu analysieren. Das in diesem Beitrag vorgestellte Korpus „Skandinavische Semikommunikation“ vereinigt die im Teilprojekt K5 „Semikommunikation und rezeptive Mehrsprachigkeit im heutigen Skandinavien“ erstellten Transkriptionsdaten und gilt als Testfall und Prototyp für die Datenbank Mehrsprachigkeit. Wie z.B. in Schmidt (2001, 2002a, 2002b, i.V.) dargestellt, fungiert dabei die XML-Anwendung EXMARaLDA als zentrale Architekturkomponente. Sie übernimmt erstens die Rolle einer Interlingua zwischen den vorhandenen älteren Datenformaten. Zweitens dient sie als Zielbzw. Ausgangsformat für mehrere Eingabeund Ausgabemethoden und bildet mit diesen zusammen ein eigenständiges System zur computergestützten Transkription. Drittens schließlich ist sie Grundlage der Datenbank Mehrsprachigkeit und der von ihr zur Verfügung zu stellenden Analyseinstrumente. Abbildung 1 auf der folgenden Seite veranschaulicht dies. Auch für das hier vorgestellte Korpus „Skandinavische Semikommunikation“ ist daher das EXMARaLDA-System von zentraler Bedeutung. Wie genau bei seiner Erstellung von den verschiedenen Eingabemethoden für Transkriptionsdaten Gebrauch gemacht wird, und welche Ausgabemethoden und Analysewerkzeuge auf die Daten angewandt werden können, wird im nächsten Abschnitt ausgeführt werden.
“斯堪的那维亚字符串”——一个以xml为基础的多种德语光盘
汉堡大学的特别研究学院“多种语文”方法在其13个次级项目中混合了许多研究者,同时也基于不同方法处理多种语文。他们利用分析系统的计算机化过程,利用口语的语言来做非正式项目,记录了大量项目。数据库多语项目的目的是为这些转录数据创造一个共同的屋顶,使能够在各个次级项目之间交换转录数据,或共同分析从不同项目收集的数据。本论文介绍的“斯堪的纳维亚符文通联”综合了K5题为“今日斯堪的纳维亚”的半边通联和可普多语特性项目所生成的转录数据,并被认为是使用多种语言数据库的测试和原型。如施密特(2001年、2000年、2002年b和2002年)的研究就说明了:xml应用为中心建筑部门。首先,他们担任的角色是在现有旧数据格式之间的界面。其次,她是一个目标或目标。若干输入和输出方法的基本格式,并协同它们组成一个独立的电脑转录系统。第三,归根结底,它是建立在多种语文系统和系统所提供的分析工具之上的。下面的图1说明了这一点。因此,前斯堪的纳维亚“斯堪的纳维亚半信半疑”体系同样至关重要。不同的转录数据输入方式和输出分析工具在编写过程中具体如何使用,在下一节将说明可适用于数据的支出方法和分析工具。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信