Query von Multiebenenannotierten XML-Dokumenten mit Prolog

LDV Forum Pub Date : 2003-07-01 DOI:10.21248/jlcl.18.2003.45

Daniela Goecke, Daniel Naber, A. Witt

{"title":"Query von Multiebenenannotierten XML-Dokumenten mit Prolog","authors":"Daniela Goecke, Daniel Naber, A. Witt","doi":"10.21248/jlcl.18.2003.45","DOIUrl":null,"url":null,"abstract":"In dem Beitrag wird ein Ansatz vorgestellt, XML-Dokumente zu analysieren, die hinsichtlich mehrerer Ebenen annotiert sind. Die Arbeiten stehen in Zusammenhang mit einem Projekt, in dem sprachliche Funktionen (insbesondere Koreferenz) in Beziehung gesetzt werden zu den sprachlichen Ausdrucksmitteln der untersuchten typologisch unterschiedlichen Sprachen. Derartige Untersuchungen bilden für eine multilingual ausgerichtete Sprachtechnologie eine wichtige Grundlage. So ist es z.B. für maschinelle Übersetzungen unabdingbar, Kenntnisse über eine angemessene Versprachlichung einer in einer Quellsprache als Pronomen realisierten koreferenten Einheit zu besitzen. Als Beispiel für die Relevanz der Verknüpfung von verschiedenen Ebenen soll in dem vorliegenden Beitrag jedoch eine andere Anwendung der hier vorgestellten Query-Möglichkeiten beschrieben werden, die ebenfalls für Arbeiten im Bereich der maschinellen Übersetzung sehr relevant ist, nämlich die Kontrollierte Sprache (vgl. Lehrndorfer 1996). Bei der Analyse von XML-Dokumenten liegt unser Schwerpunkt auf dem Vergleich von Annotationsebenen, existierende Query-Sprachen (vgl. Bonifati & Lee, 2001) legen jedoch zumeist den Schwerpunkt auf die Analyse einer einzelnen Annotationsebene. In Sprachen wie XQuery 1.0 oder XPath 1.0 werden Anfragen in XMLSyntax formuliert. Das Datenmodell ist eine Baumstruktur, Inklusionsrelationen zwischen Elementen, die durch die hierarchische Struktur der Daten gegeben sind, können einfach erfragt werden. Die Query-Sprachen erlauben zwar die Verknüpfung von verteilten Annotationen, überlappende Elemente lassen sich jedoch nicht darstellen, da für deren Modellierung eine parallele Sicht auf die Primärdaten notwendig ist. Um eine parallele Sicht zu ermöglichen, wird das Datenmodell um zusätzliche Informationen erweitert, die eine Verknüpfung der verschiedenen Annotationsebenen erlauben. Für die Realisierung dieses Ansatzes wird der Inferenzmechanismus der Programmiersprache Prolog verwendet.","PeriodicalId":346957,"journal":{"name":"LDV Forum","volume":"45 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2003-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"8","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"LDV Forum","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.21248/jlcl.18.2003.45","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 8

Abstract

In dem Beitrag wird ein Ansatz vorgestellt, XML-Dokumente zu analysieren, die hinsichtlich mehrerer Ebenen annotiert sind. Die Arbeiten stehen in Zusammenhang mit einem Projekt, in dem sprachliche Funktionen (insbesondere Koreferenz) in Beziehung gesetzt werden zu den sprachlichen Ausdrucksmitteln der untersuchten typologisch unterschiedlichen Sprachen. Derartige Untersuchungen bilden für eine multilingual ausgerichtete Sprachtechnologie eine wichtige Grundlage. So ist es z.B. für maschinelle Übersetzungen unabdingbar, Kenntnisse über eine angemessene Versprachlichung einer in einer Quellsprache als Pronomen realisierten koreferenten Einheit zu besitzen. Als Beispiel für die Relevanz der Verknüpfung von verschiedenen Ebenen soll in dem vorliegenden Beitrag jedoch eine andere Anwendung der hier vorgestellten Query-Möglichkeiten beschrieben werden, die ebenfalls für Arbeiten im Bereich der maschinellen Übersetzung sehr relevant ist, nämlich die Kontrollierte Sprache (vgl. Lehrndorfer 1996). Bei der Analyse von XML-Dokumenten liegt unser Schwerpunkt auf dem Vergleich von Annotationsebenen, existierende Query-Sprachen (vgl. Bonifati & Lee, 2001) legen jedoch zumeist den Schwerpunkt auf die Analyse einer einzelnen Annotationsebene. In Sprachen wie XQuery 1.0 oder XPath 1.0 werden Anfragen in XMLSyntax formuliert. Das Datenmodell ist eine Baumstruktur, Inklusionsrelationen zwischen Elementen, die durch die hierarchische Struktur der Daten gegeben sind, können einfach erfragt werden. Die Query-Sprachen erlauben zwar die Verknüpfung von verteilten Annotationen, überlappende Elemente lassen sich jedoch nicht darstellen, da für deren Modellierung eine parallele Sicht auf die Primärdaten notwendig ist. Um eine parallele Sicht zu ermöglichen, wird das Datenmodell um zusätzliche Informationen erweitert, die eine Verknüpfung der verschiedenen Annotationsebenen erlauben. Für die Realisierung dieses Ansatzes wird der Inferenzmechanismus der Programmiersprache Prolog verwendet.

查看原文本刊更多论文

来自于不同级别的xml文件

本文介绍了分析xml不同层次文件的方法。这项工作有一个项目，其中主要有语言功能(特别是韩朝)和被调查不同语言的语言表达手段有关。这些研究为多方语言学的发声系统提供了重要的基础。例如，机器翻译必须学会对以源代码为代名词的韩语单元适当表述语言。不过，本论文介绍了一个说明各个级别之间相关性的另一种应用，这一说明同时也与机械翻译相关:稳态语言(参本)。Lehrndorfer 1996) .我们将天天将不同的“正统”语言命名为三合会。“但部族线和部族线在2001年的首次捐赠中都着重分析…一个首次捐赠的层次以XQuery 1.0或XPath 1.0这样的语言提问就会用xml词汇来表达数据模型是一种树结构，数据背景所传递的元素都具有包容性，可以很容易地询问。尽管横切语言允许了分裂同点之间的相互联系，但覆盖元素仍然不被显示，因为他们模拟时需要对原始数据采取平行的视角。正是因此，为了构建平行视野，数据模型通过添加额外信息，将不同的诊断周期串联起来。其实，这种方法是以宝洛语的内涵机制实现的。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊

LDV Forum

自引率

0.00%

发文量