Anais da XVI Escola Regional de Banco de Dados (ERBD 2021)最新文献

筛选
英文 中文
Modelagem Probabilística de Tópicos: Uma Comparação Empírica 概率主题建模:经验比较
Anais da XVI Escola Regional de Banco de Dados (ERBD 2021) Pub Date : 2021-09-13 DOI: 10.5753/erbd.2021.17237
Leonardo H. Rocha, D. Welter, Denio Duarte
{"title":"Modelagem Probabilística de Tópicos: Uma Comparação Empírica","authors":"Leonardo H. Rocha, D. Welter, Denio Duarte","doi":"10.5753/erbd.2021.17237","DOIUrl":"https://doi.org/10.5753/erbd.2021.17237","url":null,"abstract":"Abordagens probabilísticas de tópicos são ferramentas para descobrir e explorar estruturas temáticas escondidas em coleções de textos. Dada uma coleção de documentos, a tarefa de extrair os tópicos consiste em criar um vocabulário a partir da coleção, verificar a probabilidade de cada palavra pertencer a um documento da coleção. Em seguida, baseado no número de tópicos desejado, a probabilidade de cada palavra estar associada a um determinado tópico é contabilizada. Assim, um tópico é um conjunto de palavras ordenadas pela probabilidade de estar associada ao tópico. Várias abordagens são encontradas na literatura para criação de modelos de tópicos, e.g., Hierarchical Dirichlet Process (HDP), Latent Dirichlet Allocation (LDA), Non-Negative Matrix Factorization (NMF) e Dirichlet-multinomial Regression (DMR). Este trabalho procura identificar a qualidade dos tópicos construídos pelas quatro abordagens citadas. A Qualidade será medida por métricas de coerência e todas as abordagens terão a mesma coleção de documentos como entrada: notícias de websites dos jornais Breibart, Business Insider, The Atlantic, CNN e New York Times contendo 50.000 artigos. Os resultados mostram que DMR e LDA são os melhores modelos para extrair tópicos da coleção utilizada.","PeriodicalId":293556,"journal":{"name":"Anais da XVI Escola Regional de Banco de Dados (ERBD 2021)","volume":"22 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-09-13","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"122713068","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Proposta de Algoritmo por Crescimento Gradativo de Diâmetro para Detecção de k-Flocks em Dados de Trajetórias 提出了一种直径逐渐增长算法,用于检测轨迹数据中的k- floks。
Anais da XVI Escola Regional de Banco de Dados (ERBD 2021) Pub Date : 2021-09-13 DOI: 10.5753/erbd.2021.17245
Luan Almeida, Vinicius E. C. Verdade, D. Kaster
{"title":"Proposta de Algoritmo por Crescimento Gradativo de Diâmetro para Detecção de k-Flocks em Dados de Trajetórias","authors":"Luan Almeida, Vinicius E. C. Verdade, D. Kaster","doi":"10.5753/erbd.2021.17245","DOIUrl":"https://doi.org/10.5753/erbd.2021.17245","url":null,"abstract":"Há uma demanda crescente por dispositivos para coletar e analisar informações relacionadas à geolocalização, incluindo a descoberta de padrões de comovimento de objetos móveis. Entre os padrões de comovimento mais relevantes está o padrão Flock. Um flock é um conjunto de objetos que se movem juntos, definidos por um disco móvel de diâmetro fixo, por um período consecutivo de instantes de tempo. Recentemente, foi proposta uma variação desse padrão, denominada padrão kϵ-Flocks, que dispensa a definição do parâmetro distância. O algoritmo existente para detectar kϵ-Flocks segue uma abordagem top-down, começando por umúnico flock candidato e realizando subdivisões sucessivas até encontrar k flocks com o menor diâmetro possível. Este trabalho propõe um novo algoritmo bottom-up para o problema kϵ-Flocks, baseado no agrupamento iterativo de elementos próximos no espaço até detectar os kϵ-Flocks. O trabalho descreve os fundamentos da solução, discute sua correção e apresenta o algoritmo proposto. Espera-se que o algoritmo proposto seja mais eficiente que o algoritmo top-down em muitos casos típicos.","PeriodicalId":293556,"journal":{"name":"Anais da XVI Escola Regional de Banco de Dados (ERBD 2021)","volume":"23 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-09-13","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"129828601","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Um estudo sobre reutilização de treinamento em Modelos de Previsão de Vulnerabilidade 脆弱性预测模型中培训重用的研究
Anais da XVI Escola Regional de Banco de Dados (ERBD 2021) Pub Date : 2021-09-13 DOI: 10.5753/erbd.2021.17243
Matheus Vinícius Todescato, Guilherme Dal Bianco
{"title":"Um estudo sobre reutilização de treinamento em Modelos de Previsão de Vulnerabilidade","authors":"Matheus Vinícius Todescato, Guilherme Dal Bianco","doi":"10.5753/erbd.2021.17243","DOIUrl":"https://doi.org/10.5753/erbd.2021.17243","url":null,"abstract":"Encontrar bugs ou falhas de código em sistemas pode ser uma tarefa extremamente complexa e onerosa. Uma alternativa para diminuir o esforço do usuário é aplicar o Modelo de Previsão de Vulnerabilidade (MPV). Um MPV utiliza técnicas de classificação e aprendizagem ativa para identificar trechos de código com possíveis bugs. Para isso, o MPV depende de um treinamento inicial (arquivos de código contendo bugs) na construção de um modelo de predição. Tal problema, conhecido como partida fria ou cold-start, surge quando o método não tem exemplos representativos para o início do processo. Neste trabalho, o objetivo é avaliar experimentalmente a reutilização de treinamento entre projetos com intuito de aliviar o impacto da partida fria quando se deseja encontrar todos (ou quase todos) arquivos de bug.","PeriodicalId":293556,"journal":{"name":"Anais da XVI Escola Regional de Banco de Dados (ERBD 2021)","volume":"112 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-09-13","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"131734970","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Um estudo sobre o aprimoramento de tuítes com base na substituição de adjetivos 基于形容词替换的推文改进研究
Anais da XVI Escola Regional de Banco de Dados (ERBD 2021) Pub Date : 2021-09-13 DOI: 10.5753/erbd.2021.17244
Juliano M. Pasa, L. D. Oliveira, S. L. S. Mergen
{"title":"Um estudo sobre o aprimoramento de tuítes com base na substituição de adjetivos","authors":"Juliano M. Pasa, L. D. Oliveira, S. L. S. Mergen","doi":"10.5753/erbd.2021.17244","DOIUrl":"https://doi.org/10.5753/erbd.2021.17244","url":null,"abstract":"Hoje em dia, redes sociais como o Twitter são usadas não apenas para entretenimento, mas como uma ferramenta de trabalho, seja de cunho político, artístico ou puramente comercial. Muitas das mensagens publicadas são concebidas com cuidado, de modo a fidelizar e ampliar a base de seguidores. Nesse contexto, este trabalho propõe a reescrita de tuítes visando aumentar o seu engajamento. A reescrita proposta substitui adjetivos por sinônimos considerados mais adequados, levando em consideração os adjetivos que são comumente associados à tuítes com alta taxa de engajamento. Os resultados experimentais usando um algoritmo de aprendizado de máquina como avaliador demonstram que o processo de reescrita potencialmente gera tuítes melhores.","PeriodicalId":293556,"journal":{"name":"Anais da XVI Escola Regional de Banco de Dados (ERBD 2021)","volume":"13 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-09-13","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"129950430","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Análise de Dados de Vendas de Feiras Livres: Um Estudo com a Polifeira da UFSM 自由市场销售数据分析:与UFSM政策的研究
Anais da XVI Escola Regional de Banco de Dados (ERBD 2021) Pub Date : 2021-09-13 DOI: 10.5753/erbd.2021.17247
Gabriel Mello Porcher, G. P. Silva, Daniel Lichtnow
{"title":"Análise de Dados de Vendas de Feiras Livres: Um Estudo com a Polifeira da UFSM","authors":"Gabriel Mello Porcher, G. P. Silva, Daniel Lichtnow","doi":"10.5753/erbd.2021.17247","DOIUrl":"https://doi.org/10.5753/erbd.2021.17247","url":null,"abstract":"Este trabalho apresenta análises feitas sobre os dados das vendas de uma feira livre utilizando ferramentas de Business Intelligence. As análises foram feitas mediante a elaboração de dashboards e uso de algoritmos de mineração de dados. Os resultados iniciais indicam que é possível estimar a demanda por produtos, algo que pode ser aplicado em outras feiras livres.","PeriodicalId":293556,"journal":{"name":"Anais da XVI Escola Regional de Banco de Dados (ERBD 2021)","volume":"42 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-09-13","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"133249677","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Estudos de caso de análise de perfis de usuários agrupados por hashtags no Twitter 案例研究分析用户档案按Twitter标签分组
Anais da XVI Escola Regional de Banco de Dados (ERBD 2021) Pub Date : 2021-09-13 DOI: 10.5753/erbd.2021.17250
Pedro Costa, J. R. Lima, Ronaldo A. Marques, D. Trindade, K. Komati
{"title":"Estudos de caso de análise de perfis de usuários agrupados por hashtags no Twitter","authors":"Pedro Costa, J. R. Lima, Ronaldo A. Marques, D. Trindade, K. Komati","doi":"10.5753/erbd.2021.17250","DOIUrl":"https://doi.org/10.5753/erbd.2021.17250","url":null,"abstract":"O objetivo principal do estudo foi analisar os perfis de usuários, se são ou não bots, na disseminação de uma determinada hashtag na rede social Twitter. Este trabalho apresenta o estudo de caso de duas hashtags que foram compartilhadas: uma que possui indícios de serem disseminadas por bots, e a outra não, sendo utilizada com o objetivo de comparação. Foi possível avaliar que a hashtag com indícios de ter sido impulsionada por robôs ainda apresenta perfis de usuários bots, mesmo meses depois da mesma ter sido uma trend.","PeriodicalId":293556,"journal":{"name":"Anais da XVI Escola Regional de Banco de Dados (ERBD 2021)","volume":"15 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-09-13","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"123871398","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Uso de Orientação a Objetos para a Modelagem do Autômato Celular Jogo da Vida 使用面向对象的生命游戏元胞自动机建模
Anais da XVI Escola Regional de Banco de Dados (ERBD 2021) Pub Date : 2021-09-13 DOI: 10.5753/erbd.2021.17253
F. M. Palermo, Samuel R. Cassanego, S. L. S. Mergen
{"title":"Uso de Orientação a Objetos para a Modelagem do Autômato Celular Jogo da Vida","authors":"F. M. Palermo, Samuel R. Cassanego, S. L. S. Mergen","doi":"10.5753/erbd.2021.17253","DOIUrl":"https://doi.org/10.5753/erbd.2021.17253","url":null,"abstract":"O Jogo da vida (Game of life) é um conhecido programa que usa autômatos celulares para simular a evolução de seres biológicos. Este artigo apresenta a transcrição do código estrutural deste programa para um código orientado a objetos. O objetivo da transcrição é permitir que novos comportamentos sejam adicionados de maneira simples, sem que código pre-existente precise ser modificado. Os testes demonstram que a transcrição foi bem sucedida, e abre caminho para que novos comportamentos sejam testados.","PeriodicalId":293556,"journal":{"name":"Anais da XVI Escola Regional de Banco de Dados (ERBD 2021)","volume":"104 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-09-13","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"127142499","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Visual Analytics e Outlying Aspect Mining: contextualização de anomalias considerando questões temporais e multidimensionais 视觉分析和异常方面挖掘:考虑时间和多维问题的异常背景
Anais da XVI Escola Regional de Banco de Dados (ERBD 2021) Pub Date : 2021-09-13 DOI: 10.5753/erbd.2021.17235
Felipe Marx Benghi
{"title":"Visual Analytics e Outlying Aspect Mining: contextualização de anomalias considerando questões temporais e multidimensionais","authors":"Felipe Marx Benghi","doi":"10.5753/erbd.2021.17235","DOIUrl":"https://doi.org/10.5753/erbd.2021.17235","url":null,"abstract":"Outlying Aspect Mining (OAM) is a new way of handling outliers that, instead of focusing solely on the detection, also provides an explanation. This is done by presenting a subspace of attributes that had the most abnormal behavior. Acknowledging this group of attributes is important but only listing them is not sufficient for a human specialist to comprehend the situation and take the necessary actions. A higher-level, visual approach can improve the process, providing better cognitive clues to experts. Here we describe a Visual Analytics platform developed to present data and OAM outputs in a human-friendly interface. A novelty available on this platform is a parallel coordinates plot that also display temporal multidimensional data. Such representation overcome human visual system limitations and helps in the outlier investigation. To explore the applicability of the developed tool, a locomotive operation user case is employed with focus on fault analysis in an OAM point of view.","PeriodicalId":293556,"journal":{"name":"Anais da XVI Escola Regional de Banco de Dados (ERBD 2021)","volume":"11 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-09-13","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"130245155","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Buskaki Empresas - Ferramenta para busca de dados abertos de empresas curitibanas Buskaki Empresas -搜索库里提巴公司开放数据的工具
Anais da XVI Escola Regional de Banco de Dados (ERBD 2021) Pub Date : 2021-09-13 DOI: 10.5753/erbd.2021.17233
E. S. B. Júnior, Wilian Cavassin, Nádia P. Kozievitch, M. B. Gutierrez
{"title":"Buskaki Empresas - Ferramenta para busca de dados abertos de empresas curitibanas","authors":"E. S. B. Júnior, Wilian Cavassin, Nádia P. Kozievitch, M. B. Gutierrez","doi":"10.5753/erbd.2021.17233","DOIUrl":"https://doi.org/10.5753/erbd.2021.17233","url":null,"abstract":"A busca de dados de Pessoa Jurídica é um processo relevante para diversas entidades, seja para consultar uma fonte confiável de dados sobre potenciais parceiros de negócios, para estudos relacionados a desenvolvimento urbano ou para simplesmente coletar informações sobre determinada empresa. Neste contexto, este artigo apresenta uma ferramenta para busca de informações de empresas curitibanas que disponibilize outras formas de consulta além do CNPJ, baseada em Sistemas de Informação Geográfica (SIG) e cidades inteligentes. A ferramenta utiliza dados abertos e aplica algoritmos de comparação textual para aumentar a abrangência dos resultados da busca.","PeriodicalId":293556,"journal":{"name":"Anais da XVI Escola Regional de Banco de Dados (ERBD 2021)","volume":"38 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-09-13","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"123952495","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Agrupamento de Eventos de Trânsito baseado em Tesselação 基于镶嵌的交通事件分组
Anais da XVI Escola Regional de Banco de Dados (ERBD 2021) Pub Date : 2021-09-13 DOI: 10.5753/erbd.2021.17242
Mariana M. Garcez Duarte, M. V. Pontarolo, Rebeca Schroeder Freitas, Carmem S. Hara
{"title":"Agrupamento de Eventos de Trânsito baseado em Tesselação","authors":"Mariana M. Garcez Duarte, M. V. Pontarolo, Rebeca Schroeder Freitas, Carmem S. Hara","doi":"10.5753/erbd.2021.17242","DOIUrl":"https://doi.org/10.5753/erbd.2021.17242","url":null,"abstract":"Dados coletados a partir de eventos no trânsito, como engarrafamentos e acidentes, são importantes para o planejamento da mobilidade em cidades. O desafio é transformar este conjunto de dados em conhecimento sobre mobilidade. Em razão da velocidade com que os dados são reportados, o armazenamento de eventos é geralmente feito como registros individuais. Embora este modelo de armazenamento garanta um baixo custo de inserção em uma base de dados, ele produz baixo desempenho em consultas que necessitam recuperar eventos que satisfaçam filtros espaço-temporais. Para tratar deste problema, este artigo propõe um método para o armazenamento e indexação de dados de eventos de trânsito baseado em uma tesselação da área de interesse. íE apresentado um estudo de caso que demostra sua aplicação sobre dados coletados no aplicativo Waze.","PeriodicalId":293556,"journal":{"name":"Anais da XVI Escola Regional de Banco de Dados (ERBD 2021)","volume":"52 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-09-13","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"126456005","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
相关产品
×
本文献相关产品
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信