N. Oliveira, Dianne S. V. Medeiros, Diogo M. F. Mattos
{"title":"Caracterização Sócio-Temporal de Conteúdos em Redes Sociais baseada em Processamento em Fluxo","authors":"N. Oliveira, Dianne S. V. Medeiros, Diogo M. F. Mattos","doi":"10.5753/wgrs.2021.17185","DOIUrl":null,"url":null,"abstract":"A velocidade e a dinâmica de propagação de assuntos veiculados no Twitter caracterizam a plataforma como uma fonte de dados ininterrupta. Este artigo propõe uma abordagem distribuída baseada em métricas de redes complexas para a caracterização socio-temporal de dados textuais provenientes do Twitter. A proposta integra o Apache Kafka na ingestão dos dados e o Apache Spark Streaming no processamento em fluxo dos dados para garantir a captura contínua e o processamento eficiente do conteúdo de diferentes fontes. A proposta identifica, correlaciona e monitora o uso de hashtags em tempo real, através de uma estrutura de grafo dinâmica, gerando uma ontologia sobre o tópico de interesse. Diferente de trabalhos anteriores, que empregam dados históricos, a proposta é aplicada a um caso de uso real com grande repercussão e engajamento dos usuários do Twitter. Avaliando as flutuações de métricas como centralidade, diâmetro e densidade para múltiplas componentes do grafo de hashtags, os resultados revelam tendências de escrita e padrões de relacionamento que reforçam a sensação de câmaras de eco e oportunismo midiático na lógica de utilização de hashtags.","PeriodicalId":434358,"journal":{"name":"Anais do XXVI Workshop de Gerência e Operação de Redes e Serviços (WGRS 2021)","volume":"82 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2021-08-16","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Anais do XXVI Workshop de Gerência e Operação de Redes e Serviços (WGRS 2021)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5753/wgrs.2021.17185","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
A velocidade e a dinâmica de propagação de assuntos veiculados no Twitter caracterizam a plataforma como uma fonte de dados ininterrupta. Este artigo propõe uma abordagem distribuída baseada em métricas de redes complexas para a caracterização socio-temporal de dados textuais provenientes do Twitter. A proposta integra o Apache Kafka na ingestão dos dados e o Apache Spark Streaming no processamento em fluxo dos dados para garantir a captura contínua e o processamento eficiente do conteúdo de diferentes fontes. A proposta identifica, correlaciona e monitora o uso de hashtags em tempo real, através de uma estrutura de grafo dinâmica, gerando uma ontologia sobre o tópico de interesse. Diferente de trabalhos anteriores, que empregam dados históricos, a proposta é aplicada a um caso de uso real com grande repercussão e engajamento dos usuários do Twitter. Avaliando as flutuações de métricas como centralidade, diâmetro e densidade para múltiplas componentes do grafo de hashtags, os resultados revelam tendências de escrita e padrões de relacionamento que reforçam a sensação de câmaras de eco e oportunismo midiático na lógica de utilização de hashtags.