{"title":"Classificação de opinião no Twitter em português utilizando o Multilingual Universal Sentence Encoder para apoiar pesquisas sobre filter bubble","authors":"Jônatas Castro dos Santos, S. Siqueira","doi":"10.5753/sbsc.2019.7809","DOIUrl":null,"url":null,"abstract":"Pesquisas sobre filter bubbles necessitam de mecanismos para capturar e classificar a polaridade de opinião de documentos em ambientes crowdsourced. Apresentamos um modelo preliminar baseado em aprendizado de máquina para classificar a opinião de tweets em português sobre o tema da Reforma de Previdência no contexto político brasileiro. Nossa abordagem utiliza o Multilingual Universal Sentence Encoder for Semantic Retrieval, um modelo pré-treinado recém-lançado por pesquisadores do Google para gerar representações vetoriais semanticamente ricas. Treinamos e classificamos nosso dataset em uma rede neural profunda feedfoward. Nosso modelo preliminar apresentou uma acurácia média de 82%. Esta tarefa é parte de um trabalho em andamento que visa apoiar a realização de pesquisas sobre filter bubbles.","PeriodicalId":214925,"journal":{"name":"Anais do XV Simpósio Brasileiro de Sistemas Colaborativos (SBSC 2019)","volume":"27 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2019-09-26","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"1","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Anais do XV Simpósio Brasileiro de Sistemas Colaborativos (SBSC 2019)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5753/sbsc.2019.7809","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 1
Abstract
Pesquisas sobre filter bubbles necessitam de mecanismos para capturar e classificar a polaridade de opinião de documentos em ambientes crowdsourced. Apresentamos um modelo preliminar baseado em aprendizado de máquina para classificar a opinião de tweets em português sobre o tema da Reforma de Previdência no contexto político brasileiro. Nossa abordagem utiliza o Multilingual Universal Sentence Encoder for Semantic Retrieval, um modelo pré-treinado recém-lançado por pesquisadores do Google para gerar representações vetoriais semanticamente ricas. Treinamos e classificamos nosso dataset em uma rede neural profunda feedfoward. Nosso modelo preliminar apresentou uma acurácia média de 82%. Esta tarefa é parte de um trabalho em andamento que visa apoiar a realização de pesquisas sobre filter bubbles.