Mazen Alsarem, Pierre-Edouard Portier, Sylvie Calabretto, H. Kosch
{"title":"Ordonnancement d'entités appliqué à la construction de snippets sémantiques","authors":"Mazen Alsarem, Pierre-Edouard Portier, Sylvie Calabretto, H. Kosch","doi":"10.24348/coria.2015.69","DOIUrl":null,"url":null,"abstract":"RESUME. Les avancees de l'initiative Linked Open Data (LOD) ont permis de mieux structurer le Web des donnees. En effet, quelques jeux de donnees servent de centralisateurs (par exemple, DBpedia) et permettent ainsi de maintenir les differentes sources de donnees du LOD liees entre elles. Ces jeux de donnees ont egalement permis le developpement de services de detection des entites du Web des donnees dans une page du Web des documents (par exemple, DBpedia Spotlight). Ainsi, pour permettre l'emergence de nouveaux usages qui combineront les deux Webs, nous proposons un algorithme qui ordonne les entites detectees dans une page Web en fonc-tion d'une requete exprimant un besoin d'information. Nous montrons que cet algorithme est significativement meilleur que les approches de l'etat de l'art. Enfin, nous utilisons cet algo-rithme pour construire un systeme de generation de snippets semantiques dont nous montrons experimentalement l'utilite et l'utilisabilite. ABSTRACT. The advances of the Linked Open Data (LOD) initiative are giving rise to a more structured Web of data. Indeed, a few datasets act as hubs (e.g., DBpedia) connecting many other datasets. They also made possible new Web services for entity detection inside plain text (e.g., DBpedia Spotlight), thus allowing for new applications that will benefit from a combination of the Web of documents and the Web of data. To ease the emergence of these new use-cases, we propose an algorithm for the ranking of entities, detected inside a Web page, by taking into account an information need expressed as a query. We show that this algorithm is significantly more efficient than the state of the art. Finally, we use this algorithm for the construction of semantic snippets for which we evaluate the usability and the usefulness on a panel of users.","PeriodicalId":390974,"journal":{"name":"Conférence en Recherche d'Infomations et Applications","volume":"491 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2015-03-18","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"1","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Conférence en Recherche d'Infomations et Applications","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.24348/coria.2015.69","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 1
Abstract
RESUME. Les avancees de l'initiative Linked Open Data (LOD) ont permis de mieux structurer le Web des donnees. En effet, quelques jeux de donnees servent de centralisateurs (par exemple, DBpedia) et permettent ainsi de maintenir les differentes sources de donnees du LOD liees entre elles. Ces jeux de donnees ont egalement permis le developpement de services de detection des entites du Web des donnees dans une page du Web des documents (par exemple, DBpedia Spotlight). Ainsi, pour permettre l'emergence de nouveaux usages qui combineront les deux Webs, nous proposons un algorithme qui ordonne les entites detectees dans une page Web en fonc-tion d'une requete exprimant un besoin d'information. Nous montrons que cet algorithme est significativement meilleur que les approches de l'etat de l'art. Enfin, nous utilisons cet algo-rithme pour construire un systeme de generation de snippets semantiques dont nous montrons experimentalement l'utilite et l'utilisabilite. ABSTRACT. The advances of the Linked Open Data (LOD) initiative are giving rise to a more structured Web of data. Indeed, a few datasets act as hubs (e.g., DBpedia) connecting many other datasets. They also made possible new Web services for entity detection inside plain text (e.g., DBpedia Spotlight), thus allowing for new applications that will benefit from a combination of the Web of documents and the Web of data. To ease the emergence of these new use-cases, we propose an algorithm for the ranking of entities, detected inside a Web page, by taking into account an information need expressed as a query. We show that this algorithm is significantly more efficient than the state of the art. Finally, we use this algorithm for the construction of semantic snippets for which we evaluate the usability and the usefulness on a panel of users.
摘要。链接开放数据(LOD)倡议的进展使更好地构建数据网络成为可能。事实上,一些数据集充当了集中器(例如DBpedia),从而使不同的LOD数据源相互连接。这些数据集还允许开发Web实体检测服务,用于文档Web页面中的数据(例如DBpedia Spotlight)。因此,为了允许结合两个网站的新用途的出现,我们提出了一种算法,根据表达信息需求的请求对网页中检测到的实体进行排序。我们证明了该算法明显优于最先进的方法。最后,我们使用这个算法节奏来构建一个生成语义片段的系统,我们通过实验展示了它的实用性和可用性。文摘。链接开放数据(LOD)倡议的进展导致了一个更结构化的数据网的崛起。事实上,一些数据集作为集线器(如DBpedia)连接许多其他数据集。它们还为纯文本内的实体检测提供了新的Web服务(例如,DBpedia Spotlight),从而允许新的应用程序受益于文档网和数据网的结合。为了缓解这些新用例的出现,我们提出了一种算法来对在网页中检测到的实体进行排名,考虑到以查询形式表达的信息需求。We show that this算法效率可能收到is more than the state of the art)。enfin, we use this算法for the construction of snippets for which we订立的语义usability and the panel of users据的证书。