Un canon literario universal basado en datos enciclopédicos multilingües: propuesta de un método de medición de obras literarias usando datos cuantitativos obtenidos de Wikidata y Wikipedia

IF 1 4区 管理学 Q3 INFORMATION SCIENCE & LIBRARY SCIENCE
Juan-Antonio Pastor-Sánchez, Tomás Saorín, María-José Baños-Moreno
{"title":"Un canon literario universal basado en datos enciclopédicos multilingües: propuesta de un método de medición de obras literarias usando datos cuantitativos obtenidos de Wikidata y Wikipedia","authors":"Juan-Antonio Pastor-Sánchez, Tomás Saorín, María-José Baños-Moreno","doi":"10.3989/redc.2023.3.2013","DOIUrl":null,"url":null,"abstract":"La investigación descrita en este artículo tiene como objetivo verificar la viabilidad de usar Wikidata y Wikipedia como fuente para identificar un canon literario universal. Para ello, primero se sitúan ambos proyectos de la fundación Wikimedia en el contexto de los datos sobre obras literarias. La metodología utilizada se basa en la construcción de un conjunto de datos a partir de datos específicos sobre obras literarias recuperados de Wikidata y de las ediciones de Wikipedia en todos los idiomas. Se analiza la profundidad de descripción de los ítems de obras literarias en Wikidata y su presencia y nivel de elaboración de los correspondientes artículos en Wikipedia. Mediante K-means se identifican tres clústeres de obras literarias a partir de los cuales se identifican un conjunto de obras que pueden conformar un canon literario universal. Se propone una métrica denominada Wiki3DRank que permite seleccionar y ordenar las obras literarias analizadas. El estudio aborda también algunos aspectos de la distribución por idiomas, así como un análisis específico de las asimetrías en su distribución temporal entre obras clásicas y obras contemporáneas. El artículo incluye una sección de discusión con reflexiones sobre los resultados obtenidos y concluye proponiendo Wikidata y Wikipedia como una fuente complementaria valiosa para la elaboración de cánones literarios tanto globales como de idiomas específicos.","PeriodicalId":45937,"journal":{"name":"Revista Espanola De Documentacion Cientifica","volume":"391 1","pages":""},"PeriodicalIF":1.0000,"publicationDate":"2023-07-07","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Revista Espanola De Documentacion Cientifica","FirstCategoryId":"91","ListUrlMain":"https://doi.org/10.3989/redc.2023.3.2013","RegionNum":4,"RegionCategory":"管理学","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q3","JCRName":"INFORMATION SCIENCE & LIBRARY SCIENCE","Score":null,"Total":0}
引用次数: 0

Abstract

La investigación descrita en este artículo tiene como objetivo verificar la viabilidad de usar Wikidata y Wikipedia como fuente para identificar un canon literario universal. Para ello, primero se sitúan ambos proyectos de la fundación Wikimedia en el contexto de los datos sobre obras literarias. La metodología utilizada se basa en la construcción de un conjunto de datos a partir de datos específicos sobre obras literarias recuperados de Wikidata y de las ediciones de Wikipedia en todos los idiomas. Se analiza la profundidad de descripción de los ítems de obras literarias en Wikidata y su presencia y nivel de elaboración de los correspondientes artículos en Wikipedia. Mediante K-means se identifican tres clústeres de obras literarias a partir de los cuales se identifican un conjunto de obras que pueden conformar un canon literario universal. Se propone una métrica denominada Wiki3DRank que permite seleccionar y ordenar las obras literarias analizadas. El estudio aborda también algunos aspectos de la distribución por idiomas, así como un análisis específico de las asimetrías en su distribución temporal entre obras clásicas y obras contemporáneas. El artículo incluye una sección de discusión con reflexiones sobre los resultados obtenidos y concluye proponiendo Wikidata y Wikipedia como una fuente complementaria valiosa para la elaboración de cánones literarios tanto globales como de idiomas específicos.
基于多语言百科全书数据的通用文学经典:利用维基百科和维基百科的定量数据测量文学作品的方法的建议
本文所描述的研究旨在验证使用维基百科和维基百科作为确定通用文学经典的来源的可行性。本文首先将维基媒体基金会的两个项目置于文学作品数据的背景下。使用的方法是基于从维基百科和所有语言的维基百科版本中检索到的文学作品的具体数据构建一个数据集。本文分析了维基百科中文学作品的描述深度,以及维基百科中相应文章的存在和阐述水平。通过K-means,我们确定了三个文学作品集群,从中我们确定了一组可以构成普遍文学经典的作品。本文提出了一种名为Wiki3DRank的指标,它允许对分析的文学作品进行选择和排序。该研究还讨论了语言分布的一些方面,并具体分析了古典作品和当代作品之间的时间分布不对称。本文包括一个讨论部分,对研究结果进行反思,并在结论中提出维基百科和维基百科作为全球和特定语言文学规范发展的宝贵补充来源。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
Revista Espanola De Documentacion Cientifica
Revista Espanola De Documentacion Cientifica INFORMATION SCIENCE & LIBRARY SCIENCE-
CiteScore
2.20
自引率
8.30%
发文量
34
审稿时长
48 weeks
期刊介绍: Revista española de Documentación Científica (REDC) is a journal edited by the Instituto de Estudios Documentales sobre Ciencia y Tecnología (IEDCYT, formerly CINDOC) belonging to the Consejo Superior de Investigaciones Científicas (CSIC). It is published quarterly since 1977. The main objective of this journal is to contribute to the dissemination of knowledge amongst researchers in the field of Library and Information Science and those involved in the use of scientific, technical and strategic information for science policy and decision making. REDC includes research papers dealing with experimental and theoretical topics. The articles published in REDC include titles, abstracts and key-words in English in order to facilitate its international visibility.
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信