利用机器学习检测演讲中的情绪

Mercedes Miranda-Leon, Ramón A. Toala-Dueñas
{"title":"利用机器学习检测演讲中的情绪","authors":"Mercedes Miranda-Leon, Ramón A. Toala-Dueñas","doi":"10.33386/593dp.2024.4.2367","DOIUrl":null,"url":null,"abstract":"En el contexto actual, donde las interacciones humanas se expanden en la era digital, la detección de emociones en discursos se establece como un área de investigación crucial. Este artículo se enfoca en emplear técnicas avanzadas de Machine Learning y procesamiento de audio para discernir emociones en diversos discursos. La investigación subraya la influencia de las emociones en la comunicación y señala la falta de una teoría integral que abarque el espectro emocional completo. Desde la búsqueda en fuentes académicas hasta la implementación en Google Colab con herramientas como Pydub y Librosa, la metodología abarca todas las etapas. Se recopilan discursos de distintas categorías, etiquetados manualmente en emociones positivas, negativas y neutras. El procesamiento de datos implica la conversión a formato WAV, segmentación y etiquetado. Se implementa una Red Neuronal Convolucional (CNN) para la clasificación, con una precisión del 74.07% en el conjunto de prueba, respaldando la eficacia del modelo. El análisis incluye visualizaciones de la matriz de confusión y presentación de informes de clasificación. Las conclusiones destacan la viabilidad del ML y procesamiento de audio en la detección de emociones en discursos en español, resaltando la importancia del procesamiento de datos y sugiriendo mejoras para futuras investigaciones. Este trabajo se presenta como una contribución significativa al análisis emocional del habla en español, proporcionando un sólido marco para investigaciones posteriores. \n ","PeriodicalId":488512,"journal":{"name":"593 Digital Publisher CEIT","volume":" 129","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2024-07-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Detección de emociones en discursos utilizando machine learning\",\"authors\":\"Mercedes Miranda-Leon, Ramón A. Toala-Dueñas\",\"doi\":\"10.33386/593dp.2024.4.2367\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"En el contexto actual, donde las interacciones humanas se expanden en la era digital, la detección de emociones en discursos se establece como un área de investigación crucial. Este artículo se enfoca en emplear técnicas avanzadas de Machine Learning y procesamiento de audio para discernir emociones en diversos discursos. La investigación subraya la influencia de las emociones en la comunicación y señala la falta de una teoría integral que abarque el espectro emocional completo. Desde la búsqueda en fuentes académicas hasta la implementación en Google Colab con herramientas como Pydub y Librosa, la metodología abarca todas las etapas. Se recopilan discursos de distintas categorías, etiquetados manualmente en emociones positivas, negativas y neutras. El procesamiento de datos implica la conversión a formato WAV, segmentación y etiquetado. Se implementa una Red Neuronal Convolucional (CNN) para la clasificación, con una precisión del 74.07% en el conjunto de prueba, respaldando la eficacia del modelo. El análisis incluye visualizaciones de la matriz de confusión y presentación de informes de clasificación. Las conclusiones destacan la viabilidad del ML y procesamiento de audio en la detección de emociones en discursos en español, resaltando la importancia del procesamiento de datos y sugiriendo mejoras para futuras investigaciones. Este trabajo se presenta como una contribución significativa al análisis emocional del habla en español, proporcionando un sólido marco para investigaciones posteriores. \\n \",\"PeriodicalId\":488512,\"journal\":{\"name\":\"593 Digital Publisher CEIT\",\"volume\":\" 129\",\"pages\":\"\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2024-07-04\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"593 Digital Publisher CEIT\",\"FirstCategoryId\":\"0\",\"ListUrlMain\":\"https://doi.org/10.33386/593dp.2024.4.2367\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"593 Digital Publisher CEIT","FirstCategoryId":"0","ListUrlMain":"https://doi.org/10.33386/593dp.2024.4.2367","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

摘要

当前,人际互动在数字时代不断扩大,语音中的情感检测已成为一个重要的研究领域。本文重点研究如何利用先进的机器学习和音频处理技术来辨别各种演讲中的情绪。该研究强调了情绪对交流的影响,并指出目前还缺乏涵盖所有情绪谱系的综合理论。从学术研究到利用 Pydub 和 Librosa 等工具在 Google Colab 中实施,该方法涵盖了所有阶段。从不同的类别中收集演讲内容,人工将其分为积极情绪、消极情绪和中性情绪。数据处理包括转换为 WAV 格式、分割和标记。采用卷积神经网络(CNN)进行分类,测试集的准确率为 74.07%,证明了模型的有效性。分析包括混淆矩阵和分类报告的可视化。结论强调了多重语言和音频处理在检测西班牙语语音中情绪方面的可行性,突出了数据处理的重要性,并为未来研究提出了改进建议。这项工作是对西班牙语语音情感分析的重大贡献,为进一步研究提供了坚实的框架。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
Detección de emociones en discursos utilizando machine learning
En el contexto actual, donde las interacciones humanas se expanden en la era digital, la detección de emociones en discursos se establece como un área de investigación crucial. Este artículo se enfoca en emplear técnicas avanzadas de Machine Learning y procesamiento de audio para discernir emociones en diversos discursos. La investigación subraya la influencia de las emociones en la comunicación y señala la falta de una teoría integral que abarque el espectro emocional completo. Desde la búsqueda en fuentes académicas hasta la implementación en Google Colab con herramientas como Pydub y Librosa, la metodología abarca todas las etapas. Se recopilan discursos de distintas categorías, etiquetados manualmente en emociones positivas, negativas y neutras. El procesamiento de datos implica la conversión a formato WAV, segmentación y etiquetado. Se implementa una Red Neuronal Convolucional (CNN) para la clasificación, con una precisión del 74.07% en el conjunto de prueba, respaldando la eficacia del modelo. El análisis incluye visualizaciones de la matriz de confusión y presentación de informes de clasificación. Las conclusiones destacan la viabilidad del ML y procesamiento de audio en la detección de emociones en discursos en español, resaltando la importancia del procesamiento de datos y sugiriendo mejoras para futuras investigaciones. Este trabajo se presenta como una contribución significativa al análisis emocional del habla en español, proporcionando un sólido marco para investigaciones posteriores.  
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:604180095
Book学术官方微信