基于流处理的社交网络内容的社会时间特征

N. Oliveira, Dianne S. V. Medeiros, Diogo M. F. Mattos
{"title":"基于流处理的社交网络内容的社会时间特征","authors":"N. Oliveira, Dianne S. V. Medeiros, Diogo M. F. Mattos","doi":"10.5753/wgrs.2021.17185","DOIUrl":null,"url":null,"abstract":"A velocidade e a dinâmica de propagação de assuntos veiculados no Twitter caracterizam a plataforma como uma fonte de dados ininterrupta. Este artigo propõe uma abordagem distribuída baseada em métricas de redes complexas para a caracterização socio-temporal de dados textuais provenientes do Twitter. A proposta integra o Apache Kafka na ingestão dos dados e o Apache Spark Streaming no processamento em fluxo dos dados para garantir a captura contínua e o processamento eficiente do conteúdo de diferentes fontes. A proposta identifica, correlaciona e monitora o uso de hashtags em tempo real, através de uma estrutura de grafo dinâmica, gerando uma ontologia sobre o tópico de interesse. Diferente de trabalhos anteriores, que empregam dados históricos, a proposta é aplicada a um caso de uso real com grande repercussão e engajamento dos usuários do Twitter. Avaliando as flutuações de métricas como centralidade, diâmetro e densidade para múltiplas componentes do grafo de hashtags, os resultados revelam tendências de escrita e padrões de relacionamento que reforçam a sensação de câmaras de eco e oportunismo midiático na lógica de utilização de hashtags.","PeriodicalId":434358,"journal":{"name":"Anais do XXVI Workshop de Gerência e Operação de Redes e Serviços (WGRS 2021)","volume":"82 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2021-08-16","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Caracterização Sócio-Temporal de Conteúdos em Redes Sociais baseada em Processamento em Fluxo\",\"authors\":\"N. Oliveira, Dianne S. V. Medeiros, Diogo M. F. Mattos\",\"doi\":\"10.5753/wgrs.2021.17185\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"A velocidade e a dinâmica de propagação de assuntos veiculados no Twitter caracterizam a plataforma como uma fonte de dados ininterrupta. Este artigo propõe uma abordagem distribuída baseada em métricas de redes complexas para a caracterização socio-temporal de dados textuais provenientes do Twitter. A proposta integra o Apache Kafka na ingestão dos dados e o Apache Spark Streaming no processamento em fluxo dos dados para garantir a captura contínua e o processamento eficiente do conteúdo de diferentes fontes. A proposta identifica, correlaciona e monitora o uso de hashtags em tempo real, através de uma estrutura de grafo dinâmica, gerando uma ontologia sobre o tópico de interesse. Diferente de trabalhos anteriores, que empregam dados históricos, a proposta é aplicada a um caso de uso real com grande repercussão e engajamento dos usuários do Twitter. Avaliando as flutuações de métricas como centralidade, diâmetro e densidade para múltiplas componentes do grafo de hashtags, os resultados revelam tendências de escrita e padrões de relacionamento que reforçam a sensação de câmaras de eco e oportunismo midiático na lógica de utilização de hashtags.\",\"PeriodicalId\":434358,\"journal\":{\"name\":\"Anais do XXVI Workshop de Gerência e Operação de Redes e Serviços (WGRS 2021)\",\"volume\":\"82 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2021-08-16\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Anais do XXVI Workshop de Gerência e Operação de Redes e Serviços (WGRS 2021)\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.5753/wgrs.2021.17185\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Anais do XXVI Workshop de Gerência e Operação de Redes e Serviços (WGRS 2021)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5753/wgrs.2021.17185","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

摘要

Twitter上主题传播的速度和动态使该平台成为一个不间断的数据源。本文提出了一种基于复杂网络度量的分布式方法来描述来自Twitter的文本数据的社会时间特征。提案包括Apache卡夫卡在摄入和Apache火花流媒体数据在处理fluxo确保捕获数据处理的能力和持续高效的不同来源的内容。该方案通过动态图结构实时识别、关联和监控标签的使用,生成感兴趣的主题的本体。与之前使用历史数据的工作不同,该建议被应用于一个真实的用例,在Twitter用户中有很大的反响和参与度。评估的flutuações指标为中心,直径和密度对多个组件的标签,结果显示趋势图的文字和图案的关系,加强监控媒体生态和不劳而获的感觉逻辑的使用标签。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
Caracterização Sócio-Temporal de Conteúdos em Redes Sociais baseada em Processamento em Fluxo
A velocidade e a dinâmica de propagação de assuntos veiculados no Twitter caracterizam a plataforma como uma fonte de dados ininterrupta. Este artigo propõe uma abordagem distribuída baseada em métricas de redes complexas para a caracterização socio-temporal de dados textuais provenientes do Twitter. A proposta integra o Apache Kafka na ingestão dos dados e o Apache Spark Streaming no processamento em fluxo dos dados para garantir a captura contínua e o processamento eficiente do conteúdo de diferentes fontes. A proposta identifica, correlaciona e monitora o uso de hashtags em tempo real, através de uma estrutura de grafo dinâmica, gerando uma ontologia sobre o tópico de interesse. Diferente de trabalhos anteriores, que empregam dados históricos, a proposta é aplicada a um caso de uso real com grande repercussão e engajamento dos usuários do Twitter. Avaliando as flutuações de métricas como centralidade, diâmetro e densidade para múltiplas componentes do grafo de hashtags, os resultados revelam tendências de escrita e padrões de relacionamento que reforçam a sensação de câmaras de eco e oportunismo midiático na lógica de utilização de hashtags.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信