A Comparison of Deep Learning Architectures for Automatic Gender Recognition from Audio Signals

Anais do XVIII Encontro Nacional de Inteligência Artificial e Computacional (ENIAC 2021) Pub Date : 2021-11-29 DOI:10.5753/eniac.2021.18297

A. I. S. Ferreira, Frederico S. Oliveira, Nádia Silva, A. S. Soares

引用次数: 0

Abstract

O reconhecimento de gênero a partir da fala é um problema relacionado à análise de fala humana, e possui diversas aplicações que vão desde a personalização na recomendação de produtos à ciência forense. A identificação da eficiência e custos de diferentes abordagens que lidam com esse problema é imprescindível. Este trabalho tem como foco investigar e comparar a eficiência e custos de diferentes arquiteturas de deep learning para o reconhecimento de gênero a partir da fala. Os resultados mostram que o modelo convolucional unidimensional consegue os melhores resultados. No entanto, constatou-se que o modelo fully connected apresentou resultados próximos com menor custo, tanto no uso de memória, quanto no tempo de treinamento.

查看原文本刊更多论文

基于音频信号的自动性别识别的深度学习架构比较

基于语音的性别识别是一个与人类语音分析相关的问题，它有多种应用，从产品推荐的个性化到法医学。确定处理这一问题的不同方法的效率和成本是至关重要的。本研究旨在研究和比较不同深度学习架构在语音性别识别方面的效率和成本。结果表明，一维卷积模型效果最好。然而，我们发现完全连接模型在内存使用和训练时间方面的成本都很低。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊

Anais do XVIII Encontro Nacional de Inteligência Artificial e Computacional (ENIAC 2021)

自引率

0.00%

发文量