Clasificación de tragedias y comedias en las comedias nuevas de Calderón de la Barca

Jörg Lehmann, Sebastian Padó
{"title":"Clasificación de tragedias y comedias en las comedias nuevas de Calderón de la Barca","authors":"Jörg Lehmann, Sebastian Padó","doi":"10.5944/rhd.vol.7.2022.34588","DOIUrl":null,"url":null,"abstract":"El objetivo de este estudio es clasificar 112 dramas escritos por Calderón de la Barca, comedias y tragedias, utilizando procedimientos computacionales basados en la semántica distribucional. Quince de estas comedias nuevas ya han sido clasificadas cualitativamente por investigadores especialistas como tragedias o comedias; para otros 82 dramas no había datos sobre su clasificación. En este artículo exploramos cuatro métodos independientes de document embedding que difieren entre sí, por un lado, en la creación y reducción de la matriz de rasgos y, por otro lado, en el cálculo de las matrices de similitud o distancia. Los mejores resultados medidos con respecto a los dramas clasificados manualmente se obtienen mediante el procedimiento de clasificación que aplica la reducción de información más compleja en la matriz de rasgos. Además, se lleva a cabo un análisis contrastivo de vocabulario con word embeddings. Aquí se comparan dos subcorpus que contienen obras de teatro clasificadas de manera manual y se utilizan tanto las listas de palabras producidas por los cuatro métodos probados o mediante la distribución de probabilidad log-likelihood. Este paso permite identificar 130 términos que distinguen entre comedias y tragedias. El resultado muestra que los métodos explorados identifican las tragedias con mayor precisión que las comedias, lo que indica que las primeras tienen más rasgos distintivos. También se hace evidente que se podrían considerar más adecuadamente clasificaciones como tragedia y comedia como polos de un espectro entre los que se pueden observar diferencias graduales, por lo que la zona de transición resultante contiene comedias nuevas (que han sido descritas en investigaciones anteriores como tragicomedias) o comedias mitológicas. ","PeriodicalId":362365,"journal":{"name":"Revista de Humanidades Digitales","volume":"53 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-04-12","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Revista de Humanidades Digitales","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5944/rhd.vol.7.2022.34588","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

El objetivo de este estudio es clasificar 112 dramas escritos por Calderón de la Barca, comedias y tragedias, utilizando procedimientos computacionales basados en la semántica distribucional. Quince de estas comedias nuevas ya han sido clasificadas cualitativamente por investigadores especialistas como tragedias o comedias; para otros 82 dramas no había datos sobre su clasificación. En este artículo exploramos cuatro métodos independientes de document embedding que difieren entre sí, por un lado, en la creación y reducción de la matriz de rasgos y, por otro lado, en el cálculo de las matrices de similitud o distancia. Los mejores resultados medidos con respecto a los dramas clasificados manualmente se obtienen mediante el procedimiento de clasificación que aplica la reducción de información más compleja en la matriz de rasgos. Además, se lleva a cabo un análisis contrastivo de vocabulario con word embeddings. Aquí se comparan dos subcorpus que contienen obras de teatro clasificadas de manera manual y se utilizan tanto las listas de palabras producidas por los cuatro métodos probados o mediante la distribución de probabilidad log-likelihood. Este paso permite identificar 130 términos que distinguen entre comedias y tragedias. El resultado muestra que los métodos explorados identifican las tragedias con mayor precisión que las comedias, lo que indica que las primeras tienen más rasgos distintivos. También se hace evidente que se podrían considerar más adecuadamente clasificaciones como tragedia y comedia como polos de un espectro entre los que se pueden observar diferencias graduales, por lo que la zona de transición resultante contiene comedias nuevas (que han sido descritas en investigaciones anteriores como tragicomedias) o comedias mitológicas. 
卡尔德隆·德拉·巴萨新喜剧中的悲剧和喜剧分类
本研究的目的是利用分布语料库的计算程序,对calderon de la Barca创作的112部戏剧、喜剧和悲剧进行分类。其中15部新喜剧已经被专家研究人员定性地归类为悲剧或喜剧;另外82部电视剧没有分类数据。在本文中,我们探讨了四种独立的文档嵌入方法,它们在创建和简化特征矩阵和计算相似性或距离矩阵方面各不相同。与人工分类的戏剧相比,最好的测量结果是通过分类程序获得的,该程序将更复杂的信息简化到特征矩阵中。此外,还进行了词汇与单词嵌入的对比分析。本文比较了包含手工分类的戏剧作品的两个子语料库,并使用了四种测试方法产生的单词列表或对数似是而非的概率分布。这一步可以识别出130个区分喜剧和悲剧的术语。本研究的目的是确定戏剧和喜剧之间的关系,以及戏剧和喜剧之间的关系。显然还可以考虑更适当的多极光谱分类作为悲剧和喜剧之间观察到菜单,因此差异所产生的过渡区含有喜剧新(在以前的研究中已被视为tragicomedias)或喜剧mitológicas。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信