Detección de emociones en discursos utilizando machine learning

593 Digital Publisher CEIT Pub Date : 2024-07-04 DOI:10.33386/593dp.2024.4.2367

Mercedes Miranda-Leon, Ramón A. Toala-Dueñas

{"title":"Detección de emociones en discursos utilizando machine learning","authors":"Mercedes Miranda-Leon, Ramón A. Toala-Dueñas","doi":"10.33386/593dp.2024.4.2367","DOIUrl":null,"url":null,"abstract":"En el contexto actual, donde las interacciones humanas se expanden en la era digital, la detección de emociones en discursos se establece como un área de investigación crucial. Este artículo se enfoca en emplear técnicas avanzadas de Machine Learning y procesamiento de audio para discernir emociones en diversos discursos. La investigación subraya la influencia de las emociones en la comunicación y señala la falta de una teoría integral que abarque el espectro emocional completo. Desde la búsqueda en fuentes académicas hasta la implementación en Google Colab con herramientas como Pydub y Librosa, la metodología abarca todas las etapas. Se recopilan discursos de distintas categorías, etiquetados manualmente en emociones positivas, negativas y neutras. El procesamiento de datos implica la conversión a formato WAV, segmentación y etiquetado. Se implementa una Red Neuronal Convolucional (CNN) para la clasificación, con una precisión del 74.07% en el conjunto de prueba, respaldando la eficacia del modelo. El análisis incluye visualizaciones de la matriz de confusión y presentación de informes de clasificación. Las conclusiones destacan la viabilidad del ML y procesamiento de audio en la detección de emociones en discursos en español, resaltando la importancia del procesamiento de datos y sugiriendo mejoras para futuras investigaciones. Este trabajo se presenta como una contribución significativa al análisis emocional del habla en español, proporcionando un sólido marco para investigaciones posteriores. \n ","PeriodicalId":488512,"journal":{"name":"593 Digital Publisher CEIT","volume":" 129","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2024-07-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"593 Digital Publisher CEIT","FirstCategoryId":"0","ListUrlMain":"https://doi.org/10.33386/593dp.2024.4.2367","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 0

Abstract

En el contexto actual, donde las interacciones humanas se expanden en la era digital, la detección de emociones en discursos se establece como un área de investigación crucial. Este artículo se enfoca en emplear técnicas avanzadas de Machine Learning y procesamiento de audio para discernir emociones en diversos discursos. La investigación subraya la influencia de las emociones en la comunicación y señala la falta de una teoría integral que abarque el espectro emocional completo. Desde la búsqueda en fuentes académicas hasta la implementación en Google Colab con herramientas como Pydub y Librosa, la metodología abarca todas las etapas. Se recopilan discursos de distintas categorías, etiquetados manualmente en emociones positivas, negativas y neutras. El procesamiento de datos implica la conversión a formato WAV, segmentación y etiquetado. Se implementa una Red Neuronal Convolucional (CNN) para la clasificación, con una precisión del 74.07% en el conjunto de prueba, respaldando la eficacia del modelo. El análisis incluye visualizaciones de la matriz de confusión y presentación de informes de clasificación. Las conclusiones destacan la viabilidad del ML y procesamiento de audio en la detección de emociones en discursos en español, resaltando la importancia del procesamiento de datos y sugiriendo mejoras para futuras investigaciones. Este trabajo se presenta como una contribución significativa al análisis emocional del habla en español, proporcionando un sólido marco para investigaciones posteriores.

查看原文本刊更多论文

利用机器学习检测演讲中的情绪

当前，人际互动在数字时代不断扩大，语音中的情感检测已成为一个重要的研究领域。本文重点研究如何利用先进的机器学习和音频处理技术来辨别各种演讲中的情绪。该研究强调了情绪对交流的影响，并指出目前还缺乏涵盖所有情绪谱系的综合理论。从学术研究到利用 Pydub 和 Librosa 等工具在 Google Colab 中实施，该方法涵盖了所有阶段。从不同的类别中收集演讲内容，人工将其分为积极情绪、消极情绪和中性情绪。数据处理包括转换为 WAV 格式、分割和标记。采用卷积神经网络（CNN）进行分类，测试集的准确率为 74.07%，证明了模型的有效性。分析包括混淆矩阵和分类报告的可视化。结论强调了多重语言和音频处理在检测西班牙语语音中情绪方面的可行性，突出了数据处理的重要性，并为未来研究提出了改进建议。这项工作是对西班牙语语音情感分析的重大贡献，为进一步研究提供了坚实的框架。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊

593 Digital Publisher CEIT

自引率

0.00%

发文量