Classificação de opinião no Twitter em português utilizando o Multilingual Universal Sentence Encoder para apoiar pesquisas sobre filter bubble

Anais do XV Simpósio Brasileiro de Sistemas Colaborativos (SBSC 2019) Pub Date : 2019-09-26 DOI:10.5753/sbsc.2019.7809

Jônatas Castro dos Santos, S. Siqueira

引用次数: 1

Abstract

Pesquisas sobre filter bubbles necessitam de mecanismos para capturar e classificar a polaridade de opinião de documentos em ambientes crowdsourced. Apresentamos um modelo preliminar baseado em aprendizado de máquina para classificar a opinião de tweets em português sobre o tema da Reforma de Previdência no contexto político brasileiro. Nossa abordagem utiliza o Multilingual Universal Sentence Encoder for Semantic Retrieval, um modelo pré-treinado recém-lançado por pesquisadores do Google para gerar representações vetoriais semanticamente ricas. Treinamos e classificamos nosso dataset em uma rede neural profunda feedfoward. Nosso modelo preliminar apresentou uma acurácia média de 82%. Esta tarefa é parte de um trabalho em andamento que visa apoiar a realização de pesquisas sobre filter bubbles.

查看原文本刊更多论文

葡萄牙语Twitter意见评级使用多语言通用句子编码器支持过滤气泡研究

过滤气泡的研究需要在众包环境中捕捉和分类文档意见极性的机制。我们提出了一个基于机器学习的初步模型，用于在巴西政治背景下对葡萄牙语推文中关于养老金改革主题的观点进行分类。我们的方法使用多语言通用句子编码器进行语义检索，这是谷歌研究人员最近发布的一个预训练模型，用于生成语义丰富的向量表示。我们在一个深度神经网络前馈中训练和分类我们的数据集。我们的初步模型的平均准确率为82%。这项任务是一项正在进行的工作的一部分，旨在支持过滤气泡的研究。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊

Anais do XV Simpósio Brasileiro de Sistemas Colaborativos (SBSC 2019)

自引率

0.00%

发文量