{"title":"Clasificación de tragedias y comedias en las comedias nuevas de Calderón de la Barca","authors":"Jörg Lehmann, Sebastian Padó","doi":"10.5944/rhd.vol.7.2022.34588","DOIUrl":null,"url":null,"abstract":"El objetivo de este estudio es clasificar 112 dramas escritos por Calderón de la Barca, comedias y tragedias, utilizando procedimientos computacionales basados en la semántica distribucional. Quince de estas comedias nuevas ya han sido clasificadas cualitativamente por investigadores especialistas como tragedias o comedias; para otros 82 dramas no había datos sobre su clasificación. En este artículo exploramos cuatro métodos independientes de document embedding que difieren entre sí, por un lado, en la creación y reducción de la matriz de rasgos y, por otro lado, en el cálculo de las matrices de similitud o distancia. Los mejores resultados medidos con respecto a los dramas clasificados manualmente se obtienen mediante el procedimiento de clasificación que aplica la reducción de información más compleja en la matriz de rasgos. Además, se lleva a cabo un análisis contrastivo de vocabulario con word embeddings. Aquí se comparan dos subcorpus que contienen obras de teatro clasificadas de manera manual y se utilizan tanto las listas de palabras producidas por los cuatro métodos probados o mediante la distribución de probabilidad log-likelihood. Este paso permite identificar 130 términos que distinguen entre comedias y tragedias. El resultado muestra que los métodos explorados identifican las tragedias con mayor precisión que las comedias, lo que indica que las primeras tienen más rasgos distintivos. También se hace evidente que se podrían considerar más adecuadamente clasificaciones como tragedia y comedia como polos de un espectro entre los que se pueden observar diferencias graduales, por lo que la zona de transición resultante contiene comedias nuevas (que han sido descritas en investigaciones anteriores como tragicomedias) o comedias mitológicas. ","PeriodicalId":362365,"journal":{"name":"Revista de Humanidades Digitales","volume":"53 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-04-12","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Revista de Humanidades Digitales","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5944/rhd.vol.7.2022.34588","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
El objetivo de este estudio es clasificar 112 dramas escritos por Calderón de la Barca, comedias y tragedias, utilizando procedimientos computacionales basados en la semántica distribucional. Quince de estas comedias nuevas ya han sido clasificadas cualitativamente por investigadores especialistas como tragedias o comedias; para otros 82 dramas no había datos sobre su clasificación. En este artículo exploramos cuatro métodos independientes de document embedding que difieren entre sí, por un lado, en la creación y reducción de la matriz de rasgos y, por otro lado, en el cálculo de las matrices de similitud o distancia. Los mejores resultados medidos con respecto a los dramas clasificados manualmente se obtienen mediante el procedimiento de clasificación que aplica la reducción de información más compleja en la matriz de rasgos. Además, se lleva a cabo un análisis contrastivo de vocabulario con word embeddings. Aquí se comparan dos subcorpus que contienen obras de teatro clasificadas de manera manual y se utilizan tanto las listas de palabras producidas por los cuatro métodos probados o mediante la distribución de probabilidad log-likelihood. Este paso permite identificar 130 términos que distinguen entre comedias y tragedias. El resultado muestra que los métodos explorados identifican las tragedias con mayor precisión que las comedias, lo que indica que las primeras tienen más rasgos distintivos. También se hace evidente que se podrían considerar más adecuadamente clasificaciones como tragedia y comedia como polos de un espectro entre los que se pueden observar diferencias graduales, por lo que la zona de transición resultante contiene comedias nuevas (que han sido descritas en investigaciones anteriores como tragicomedias) o comedias mitológicas.
本研究的目的是利用分布语料库的计算程序,对calderon de la Barca创作的112部戏剧、喜剧和悲剧进行分类。其中15部新喜剧已经被专家研究人员定性地归类为悲剧或喜剧;另外82部电视剧没有分类数据。在本文中,我们探讨了四种独立的文档嵌入方法,它们在创建和简化特征矩阵和计算相似性或距离矩阵方面各不相同。与人工分类的戏剧相比,最好的测量结果是通过分类程序获得的,该程序将更复杂的信息简化到特征矩阵中。此外,还进行了词汇与单词嵌入的对比分析。本文比较了包含手工分类的戏剧作品的两个子语料库,并使用了四种测试方法产生的单词列表或对数似是而非的概率分布。这一步可以识别出130个区分喜剧和悲剧的术语。本研究的目的是确定戏剧和喜剧之间的关系,以及戏剧和喜剧之间的关系。显然还可以考虑更适当的多极光谱分类作为悲剧和喜剧之间观察到菜单,因此差异所产生的过渡区含有喜剧新(在以前的研究中已被视为tragicomedias)或喜剧mitológicas。