Análise de Performance dos Modelos Gerais de Aprendizado de Máquina Pré-Treinados: BERT vs DistilBERT

Anais Estendidos do XL Simpósio Brasileiro de Redes de Computadores e Sistemas Distribuídos (SBRC Estendido 2022) Pub Date : 2022-05-23 DOI:10.5753/sbrc_estendido.2022.223391

R. Barbon, A. T. Akabane

引用次数: 0

Abstract

Modelos de aprendizado de máquina (AM) vêm sendo amplamente utilizados devido à elevada quantidade de dados produzidos diariamente. Dentre eles, destaca-se os modelos pré-treinados devido a sua eficácia, porém estes normalmente demandam um elevado custo computacional na execução de sua tarefa. A fim de contornar esse problema, técnicas de compressão de redes neurais vem sendo aplicadas para produzir modelos pré-treinados menores sem comprometer a acurácia. Com isso, neste trabalho foram utilizados dois diferentes modelos pré-treinados de AM: BERT e DistilBERT na classificação de texto. Os resultados apontam que modelos menores apresentam bons resultados quando comparados com seus equivalentes maiores.

查看原文本刊更多论文

一般预训练机器学习模型的性能分析:BERT vs DistilBERT

机器学习模型由于每天产生大量的数据而被广泛使用。其中，预训练模型由于其有效性而脱颖而出，但它们在执行任务时通常需要很高的计算成本。为了解决这个问题，神经网络压缩技术被应用于生成更小的预训练模型而不影响精度。因此，本研究采用两种不同的预训练模型:BERT和DistilBERT进行文本分类。结果表明，较小的模型与较大的模型相比表现出良好的结果。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊

Anais Estendidos do XL Simpósio Brasileiro de Redes de Computadores e Sistemas Distribuídos (SBRC Estendido 2022)

自引率

0.00%

发文量