Ramon Barros de Lima, Wilamis Micael de Araújo Aviz, Fábio J. Coutinho, João Paulo Clarindo
{"title":"Métodos para auxílio na tomada de decisão em cidades inteligentes","authors":"Ramon Barros de Lima, Wilamis Micael de Araújo Aviz, Fábio J. Coutinho, João Paulo Clarindo","doi":"10.5753/sbbd_estendido.2021.18159","DOIUrl":"https://doi.org/10.5753/sbbd_estendido.2021.18159","url":null,"abstract":"Nos últimos anos, com o crescente aumento da população em áreas urbanas, cidades inteligentes surgem como uma alternativa para auxiliar gestores na tomada de decisão, através da utilização de uma rede de dispositivos IoT, que geram dados relativos à infraestrutura urbana. Entretanto, o número de dispositivos IoT cresce constantemente, gerando um imenso volume de dados convencionais e espaciais. Diante disso, este trabalho discute métodos para auxiliar na tomada de decisão no contexto de cidades inteligentes, a partir do uso de técnicas de pré-processamento dos dados brutos gerados por dispositivos IoT, armazenamento e processamento paralelo e distribuído de dados espaciais. Foi desenvolvido um estudo de caso com dados de cerca de 500 mil corridas de táxi ocorridas em Porto, Portugal, que apresenta resultados que podem auxiliar gestores na melhoria do serviço de transportes da cidade.","PeriodicalId":232860,"journal":{"name":"Anais Estendidos do XXXVI Simpósio Brasileiro de Banco de Dados (SBBD Estendido 2021)","volume":"18 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-10-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"124114142","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
José Maria da Silva Monteiro Filho, Ivandro Claudino de Sá, Lucas Cabral Carneiro da Cunha, Helena Martins do Rego Barreto, Pedro Jorge Chaves Mourão
{"title":"Digital Lighthouse Platform: Understanding the Misinformation Phenomenon on WhatsApp","authors":"José Maria da Silva Monteiro Filho, Ivandro Claudino de Sá, Lucas Cabral Carneiro da Cunha, Helena Martins do Rego Barreto, Pedro Jorge Chaves Mourão","doi":"10.5753/sbbd_estendido.2021.18178","DOIUrl":"https://doi.org/10.5753/sbbd_estendido.2021.18178","url":null,"abstract":"In the past few years, the large-scale dissemination of misinformation through social media has become a critical issue, harming the trustworthiness of legit information, social stability, democracy and public health. In many developing countries such as Brazil, India, and Mexico, one of the primary sources of misinformation is the messaging application WhatsApp. In February 2020, the Panorama Mobile Time/Opinion Box survey on mobile messaging in Brazil revealed that WhatsApp was installed on 99% of Brazilian smartphones. Among users of the application, 98% said they access it every day or almost every day. In this context, WhatsApp provides an important feature: the public groups. Many of these groups have been used to spread misinformation, especially as part of articulated political or ideological campaigns. Despite this scenario, due to WhatsApp's private messaging nature, few methods were explicitly developed to investigate the misinformation phenomenon on this platform. This tutorial provides an overview of recent developments in monitoring misinformation spreading, automatic misinformation detection, and identifying misinformation spreaders. In addition, we provide an overview of the leading open problems associated with the misinformation phenomenon and briefly examine some of the existing solutions. We hope that our tutorial can help researchers better understand Brazil's misinformation propagation and use data science methods to face this critical phenomenon.","PeriodicalId":232860,"journal":{"name":"Anais Estendidos do XXXVI Simpósio Brasileiro de Banco de Dados (SBBD Estendido 2021)","volume":"35 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-10-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"115811312","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Ítalo C. de Abreu, Francisco D. B. S. Praciano, Paulo R. P. Amora, Javam C. Machado
{"title":"ConSQL: Consentimentos em SQL para o Processamento de Consultas Orientado a Propósitos","authors":"Ítalo C. de Abreu, Francisco D. B. S. Praciano, Paulo R. P. Amora, Javam C. Machado","doi":"10.5753/sbbd_estendido.2021.18156","DOIUrl":"https://doi.org/10.5753/sbbd_estendido.2021.18156","url":null,"abstract":"Em vista da crescente necessidade de garantir a proteção de dados pessoais e a privacidade dos indivíduos em um mundo cada vez mais informatizado é crucial que os SGBDs deem suporte a técnicas que facilitem a aplicação dessas garantias quando envolvem dados sob sua gestão, como o direito ao consentimento, onde o indivíduo define os propósitos de acesso e de processamento dos seus dados. Neste trabalho, apresentamos uma extensão da gramática SQL, chamada ConSQL, que permite a definição e a manutenção de propósitos de acesso a relações, tuplas e atributos de um banco de dados relacional. ConSQL, completamente integrada ao processo de reconhecimento de SQL no PostgreSQL, gera estruturas de dados associadas ao esquema de um banco de dados para posterior utilização na verificação de propósitos em tempo de execução de consultas. O artigo também descreve, por meio de exemplos expressos em ConSQL, consentimentos de usuários e mostra a utilidade deles no processamento de consultas que assegura a aplicação de propósitos.","PeriodicalId":232860,"journal":{"name":"Anais Estendidos do XXXVI Simpósio Brasileiro de Banco de Dados (SBBD Estendido 2021)","volume":"1 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-10-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"124203330","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Washington Cunha, Leonardo Rocha, Marcos André Gonçalves
{"title":"Extended Pre-Processing Pipeline For Text Classification: On the Role of Meta-Features, Sparsification and Selective Sampling","authors":"Washington Cunha, Leonardo Rocha, Marcos André Gonçalves","doi":"10.5753/sbbd_estendido.2021.18180","DOIUrl":"https://doi.org/10.5753/sbbd_estendido.2021.18180","url":null,"abstract":"Pipelines for Text Classification are sequences of tasks needed to be performed to classify documents. The pre-processing phase of these pipelines involves different ways of manipulating documents for the learning phase. This Master Thesis introduces three new steps into the traditional pre-processing phase: 1) Meta-Features Generation; 2) Sparsification; and 3) Selective Sampling. Our experimental results, based on more than 5.600 measurements, show that our proposal can achieve significant gains in effectiveness when compared to the traditional TF-IDF representation (up to 52%) and word embeddings (up to 46%), at a much lower cost (9.7x faster). Our Master Thesis also includes a thorough and rigorous evaluation of the trade-offs between cost and effectiveness associated with the introduction of these new steps into the pipeline, as well as a comprehensive comparative experimental evaluation of many alternatives. This thesis falls under the topics of (i) Document Management and Classification, (ii) Information Retrieval Models and Techniques, (iii) and Text Database of the SBBD Call for Papers.","PeriodicalId":232860,"journal":{"name":"Anais Estendidos do XXXVI Simpósio Brasileiro de Banco de Dados (SBBD Estendido 2021)","volume":"17 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-10-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"114344234","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
{"title":"Compiladores para as Linguagens da Abordagem WED-flow","authors":"Eduardo D. Filho, Bruno Padilha, J. Ferreira","doi":"10.5753/sbbd_estendido.2021.18166","DOIUrl":"https://doi.org/10.5753/sbbd_estendido.2021.18166","url":null,"abstract":"A abordagem WED-flow propõe modelar e implementar Sistemas de Informação Cientes de Processos (PAIS) a partir da especificação de eventos, dados e tarefas de um processo de negócio, oferecendo a execução de instâncias do processo em um ambiente transacional definido sobre um banco de dados. A implementação atual da WED-flow permite que as definições sejam especificadas por meio de uma notação de conjuntos ou por meio de uma linguagem intermediária chamada WED-SQL. Ambas as linguagens devem ser traduzidas para SQL para simplificar a integração com bancos de dados relacionais. Este trabalho propõe a especificação de gramáticas formais e a implementação de compiladores dessas duas linguagens para a linguagem alvo SQL.","PeriodicalId":232860,"journal":{"name":"Anais Estendidos do XXXVI Simpósio Brasileiro de Banco de Dados (SBBD Estendido 2021)","volume":"149 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-10-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"132658412","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Débora B. Pina, L. Neves, Daniel de Oliveira, M. Mattoso
{"title":"Captura Automática de Dados de Proveniência de Experimentos de Aprendizado de Máquina com Keras-Prov","authors":"Débora B. Pina, L. Neves, Daniel de Oliveira, M. Mattoso","doi":"10.5753/sbbd_estendido.2021.18165","DOIUrl":"https://doi.org/10.5753/sbbd_estendido.2021.18165","url":null,"abstract":"Neste artigo apresentamos a Keras-Prov, uma extensão à biblioteca de aprendizado profundo Keras para prover dados de proveniência. A Keras-Prov captura, armazena e gerencia metadados e dados de proveniência de experimentos de aprendizado de máquina (ML), em especial de aprendizado profundo. A Keras-Prov identifica automaticamente as transformações de dados mais comuns, como, treinamento, teste, e adaptação, para capturar os dados de proveniência. A Keras-Prov flexibiliza a captura automática, permitindo que novos dados de proveniência sejam definidos, como valores adicionais de hiperparâmetros. À gerência de proveniência por meio do SGBD colunar MonetDB, Keras-Prov adiciona uma interface de monitoramento visual e um gerador de SQL para consultas analíticas aos dados durante a evolução do treinamento e a escolha de modelos. A análise de dados da Keras-Prov, durante o treinamento, subsidia decisões de sintonia fina de hiperparâmetros. A base de dados segue a recomendação W3C PROV, favorecendo a comparação, explicação e reprodução de tais experimentos de ML. A Keras-Prov é uma solução de código aberto e pode ser obtida em https://github.com/dbpina/keras-prov.","PeriodicalId":232860,"journal":{"name":"Anais Estendidos do XXXVI Simpósio Brasileiro de Banco de Dados (SBBD Estendido 2021)","volume":"36 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-10-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"126213025","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
{"title":"User Steering Support in Large-scale Workflows","authors":"Renan Souza, M. Mattoso, P. Valduriez","doi":"10.5753/sbbd_estendido.2021.18185","DOIUrl":"https://doi.org/10.5753/sbbd_estendido.2021.18185","url":null,"abstract":"Large-scale workflows that execute on High-Performance Computing machines need to be dynamically steered by users. This means that users analyze big data files, assess key performance indicators, fine-tune parameters, and evaluate the tuning impacts while the workflows generate multiple files, which is challenging. If one does not keep track of such interactions (called user steering actions), it may be impossible to understand the consequences of steering actions and to reproduce the results. This thesis proposes a generic approach to enable tracking user steering actions by characterizing, capturing, relating, and analyzing them by leveraging provenance data management concepts. Experiments with real users show that the approach enabled the understanding of the impact of steering actions while incurring negligible overhead.","PeriodicalId":232860,"journal":{"name":"Anais Estendidos do XXXVI Simpósio Brasileiro de Banco de Dados (SBBD Estendido 2021)","volume":"42 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-10-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"115862808","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Ronney Nery Silva, José Maria Monteiro, Wellington Franco
{"title":"FarolKG: Um Grafo de Conhecimento sobre Desinformação em Mensagens do WhatsApp","authors":"Ronney Nery Silva, José Maria Monteiro, Wellington Franco","doi":"10.5753/sbbd_estendido.2021.18175","DOIUrl":"https://doi.org/10.5753/sbbd_estendido.2021.18175","url":null,"abstract":"A popularização das redes sociais gerou um ambiente propício para o espalhamento em massa de desinformação. Atualmente, a principal ferramenta utilizada para propagação de desinformação são os grupos públicos do WhatsApp. Neste trabalho, propomos o FarolKG, um grafo de conhecimento (KG) sobre as desinformações que são propagadas por meio dos grupos públicos do WhatsApp. A utilização do FarolKG irá facilitar a execução de consultas estruturadas envolvendo tanto os textos das mensagens quanto os seus metadados. O FarolKG será gerado por meio de um pipeline semiautomático, que coleta dados periodicamente de grupos públicos do WhatsApp, de sites populares de verificação de fatos e da DBPedia. O FarolKG permitirá a exploração avançada e a descoberta de informações, por exemplo, por meio de consultas na linguagem SPARQL. Adicionalmente, o FarolKG irá disponibilizar uma interface Web que possibilitará a construção de consultas de forma visual.","PeriodicalId":232860,"journal":{"name":"Anais Estendidos do XXXVI Simpósio Brasileiro de Banco de Dados (SBBD Estendido 2021)","volume":"1 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-10-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"116195334","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Antônio Diogo Forte Martins, José Maria S. Monteiro, Javam C. Machado
{"title":"Automatic Misinformation Detection About COVID-19 in Brazilian Portuguese WhatsApp Messages","authors":"Antônio Diogo Forte Martins, José Maria S. Monteiro, Javam C. Machado","doi":"10.5753/sbbd_estendido.2021.18173","DOIUrl":"https://doi.org/10.5753/sbbd_estendido.2021.18173","url":null,"abstract":"During the coronavirus pandemic, the problem of misinformation arose once again, quite intensely, through social networks. In Brazil, one of the primary sources of misinformation is the messaging application WhatsApp. However, due to WhatsApp's private messaging nature, there still few methods of misinformation detection developed specifically for this platform. In this context, the automatic misinformation detection (MID) about COVID-19 in Brazilian Portuguese WhatsApp messages becomes a crucial challenge. In this work, we present the COVID-19.BR, a data set of WhatsApp messages about coronavirus in Brazilian Portuguese, collected from Brazilian public groups and manually labeled. Then, we are investigating different machine learning methods in order to build an efficient MID for WhatsApp messages. So far, our best result achieved an F1 score of 0.774 due to the predominance of short texts. However, when texts with less than 50 words are filtered, the F1 score rises to 0.85.","PeriodicalId":232860,"journal":{"name":"Anais Estendidos do XXXVI Simpósio Brasileiro de Banco de Dados (SBBD Estendido 2021)","volume":"58 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-10-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"126638845","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Mariana D. A. Salgueiro, Verônica dos Santos, André L. C. Rêgo, Daniel S. Guimarães, E. Haeusler, Jefferson B. dos Santos, M. V. Villas, Sérgio Lifschitz
{"title":"Quem@PUC - A tool to find researchers at PUC-Rio","authors":"Mariana D. A. Salgueiro, Verônica dos Santos, André L. C. Rêgo, Daniel S. Guimarães, E. Haeusler, Jefferson B. dos Santos, M. V. Villas, Sérgio Lifschitz","doi":"10.5753/sbbd_estendido.2021.18169","DOIUrl":"https://doi.org/10.5753/sbbd_estendido.2021.18169","url":null,"abstract":"Quem@PUC is an Information Retrieval System available on the Web that allows searching for researchers and professors based on a keyword list of research related terms. It publicizes research and teaching activities from the PUC-Rio community to society in general. The idea is to integrate information from professors from administrative systems, courses offered, and researchers’ Lattes CVs. Data sources are converted to RDF format using domain ontologies, then stored in a NoSQL database that supports native free-text indexing on triple objects. Search results include names, academic papers, teaching activities, and contact links.","PeriodicalId":232860,"journal":{"name":"Anais Estendidos do XXXVI Simpósio Brasileiro de Banco de Dados (SBBD Estendido 2021)","volume":"18 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-10-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"122330485","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}