Anais do III Dataset Showcase Workshop (DSW 2021)最新文献

筛选
英文 中文
BovDB: A data set of stock quotes for Machine Learning on all companies from B3 between 1995 and 2020 BovDB: 1995年至2020年期间机器学习B3级所有公司的股票报价数据集
Anais do III Dataset Showcase Workshop (DSW 2021) Pub Date : 2021-10-04 DOI: 10.5753/dsw.2021.17411
Fabian Corrêa Cardoso, J. Malska, P. Ramiro, Giancarlo Lucca, E. N. Borges, V. Mattos, R. Berri
{"title":"BovDB: A data set of stock quotes for Machine Learning on all companies from B3 between 1995 and 2020","authors":"Fabian Corrêa Cardoso, J. Malska, P. Ramiro, Giancarlo Lucca, E. N. Borges, V. Mattos, R. Berri","doi":"10.5753/dsw.2021.17411","DOIUrl":"https://doi.org/10.5753/dsw.2021.17411","url":null,"abstract":"Stock markets are responsible for the movement of huge amounts of financial resources around the world. This market generates a high volume of transaction data, which after being analyzed are very useful for many applications. In this paper we present BovDB, a data set that was built considering as source the Brazilian Stock Exchange (B3) with information related to the years between 1995 and 2020. We have approached the events’ impact on the stocks by applying a cumulative factor to correct prices. The results were compared with public data from InfoMoney and BR Investing, showing that our methods are valid and in accordance with the market standards. BovDB data set can be used as a benchmark for different applications and is publicly available for any researcher on GitHub.","PeriodicalId":314975,"journal":{"name":"Anais do III Dataset Showcase Workshop (DSW 2021)","volume":"94 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-10-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"123527338","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Datasets Curados e Enriquecidos com Proveniência da Campanha Nacional de Vacinação Contra COVID-19 从国家COVID-19疫苗接种运动中治愈和丰富的数据集
Anais do III Dataset Showcase Workshop (DSW 2021) Pub Date : 2021-10-04 DOI: 10.5753/dsw.2021.17423
M. V. Gonçalves, Jamile Santos dos Santos, Caio Zava Ferreira, Jorge Zavaleta, Sérgio Manuel Serra da Cruz, Jonice de Oliveira Sampaio
{"title":"Datasets Curados e Enriquecidos com Proveniência da Campanha Nacional de Vacinação Contra COVID-19","authors":"M. V. Gonçalves, Jamile Santos dos Santos, Caio Zava Ferreira, Jorge Zavaleta, Sérgio Manuel Serra da Cruz, Jonice de Oliveira Sampaio","doi":"10.5753/dsw.2021.17423","DOIUrl":"https://doi.org/10.5753/dsw.2021.17423","url":null,"abstract":"A pandemia da COVID-19 é uma ameaça global. Se, por um lado, contabilizamos muitas perdas de vidas, por outro lado tem-se acelerado a geração de datasets e demandas analíticas urgentes. Dentre as estratégias de combate, destacam-se a vacinação e as investigações epidemiológicas centradas em dados. Este artigo apresenta o processo de construção de datasets curados e anotados com metadados de proveniência retrospectiva, tendo como base os dados de registro da Campanha de Vacinação contra COVID-19 no Brasil. O dataset contém milhares de registros tratados até Março de 2021. Os dados foram analisados, investigados, tratados e cruzados com outras fontes, de modo a corrigi-los e complementá-los, resultando em datasets curados e alinhados aos princípios FAIR.","PeriodicalId":314975,"journal":{"name":"Anais do III Dataset Showcase Workshop (DSW 2021)","volume":"73 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-10-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"115530966","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 10
Coleta e visualização de dados disponíveis em repositórios públicos referentes a produção científica de pesquisadores 收集和可视化公共存储库中有关研究人员科学生产的可用数据
Anais do III Dataset Showcase Workshop (DSW 2021) Pub Date : 2021-10-04 DOI: 10.5753/dsw.2021.17418
A. M. Branco, C. Dorneles
{"title":"Coleta e visualização de dados disponíveis em repositórios públicos referentes a produção científica de pesquisadores","authors":"A. M. Branco, C. Dorneles","doi":"10.5753/dsw.2021.17418","DOIUrl":"https://doi.org/10.5753/dsw.2021.17418","url":null,"abstract":"Dados que refletem a produção científica de pesquisadores têm valor inestimado para diversas aplicações. Há diversos repositórios que indexam os artigos e os disponibilizam para consultas, tais como DBLP, Research Gate e Google Scholar. Apesar dos dados estarem disponíveis nos diversos repositórios públicos, a coleta e persistência local desses dados pode ser de grande utilidade para certas aplicações.Este artigo apresenta uma proposta de coletor de dados de três repositórios públicos: DBLP, Research Gate e Google Scholar, e sua posterior persistência em um banco de dados relacional. Além disso, é apresentada também uma interface de visualização para os dados coletados.","PeriodicalId":314975,"journal":{"name":"Anais do III Dataset Showcase Workshop (DSW 2021)","volume":"34 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-10-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"134455482","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Três Datasets criados a partir de um banco de Canções Populares Brasileiras de Sucesso e Não-Sucesso de 2014 a 2019 从2014年到2019年巴西流行歌曲的成功和不成功的数据库中创建了三个数据集
Anais do III Dataset Showcase Workshop (DSW 2021) Pub Date : 2021-10-04 DOI: 10.5753/dsw.2021.17410
André Augusto Bertoni, R. Lemos
{"title":"Três Datasets criados a partir de um banco de Canções Populares Brasileiras de Sucesso e Não-Sucesso de 2014 a 2019","authors":"André Augusto Bertoni, R. Lemos","doi":"10.5753/dsw.2021.17410","DOIUrl":"https://doi.org/10.5753/dsw.2021.17410","url":null,"abstract":"Este trabalho trata da criação e otimização de um grande conjunto de características extraídas de um banco de 881 canções populares brasileiras de Sucesso e Não-Sucesso, entre janeiro de 2014 a maio de 2019. A partir desse banco de canções, criou-se três DataSets de características (features) distintas, sendo que o primeiro contém 3215 características estatísticas; o segundo e o terceiro são totalmente inéditos, pois foram formados a partir da Melodia Vocal das canções (Melodia Predominante da Voz), não havendo banco semelhante disponível para pesquisa. O segundo banco representa um gráfico de espectrograma, formado a partir dos 90 segundos iniciais de cada canção. O terceiro banco é o mais peculiar de todos, pois representa uma análise semântica musical do segundo banco, onde a finalidade principal foi construir uma tabela composta pelas sequências melódicas mais frequentes de cada canção. Nossos Datasets usam apenas canções brasileiras e concentram seus dados em um período limitado e contemporâneo. A ideia da criação desses conjuntos de dados é estimular o estudo de técnicas de Aprendizado de Máquina que requeiram informações musicais. Os recursos extraídos podem auxiliar no desenvolvimento de novas pesquisas nas áreas da música e computação no futuro.","PeriodicalId":314975,"journal":{"name":"Anais do III Dataset Showcase Workshop (DSW 2021)","volume":"2 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-10-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"122356421","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 3
CandiDATA: um dataset para análise das eleições no Brasil 候选人:分析巴西选举的数据集
Anais do III Dataset Showcase Workshop (DSW 2021) Pub Date : 2021-10-04 DOI: 10.5753/dsw.2021.17424
Felipe F. Vasconcelos, João Tavares, Murilo U. Ribeiro, Fábio J. Coutinho, João Paulo Clarindo
{"title":"CandiDATA: um dataset para análise das eleições no Brasil","authors":"Felipe F. Vasconcelos, João Tavares, Murilo U. Ribeiro, Fábio J. Coutinho, João Paulo Clarindo","doi":"10.5753/dsw.2021.17424","DOIUrl":"https://doi.org/10.5753/dsw.2021.17424","url":null,"abstract":"O Tribunal Superior Eleitoral (TSE), responsável pelas eleições no Brasil, disponibiliza dados acerca de candidatos e partidos que disputaram o pleito eleitoral desde 1933. Esses dados constituem um importante acervo, sendo utilizados como base por trabalhos em diferentes áreas de pesquisa. Entretanto, os dados disponibilizados pelo TSE possuem diversos problemas relacionados à falta de padronização e inconsistência, dificultando a análise e a integração com bases externas. Este trabalho apresenta CandiDATA, um dataset padronizado com dados das eleições brasileiras. CandiDATA é disponibilizado em formato aberto e abrange o período eleitoral entre 1945 e 2020, incluindo informações adicionais, além dos dados do TSE.","PeriodicalId":314975,"journal":{"name":"Anais do III Dataset Showcase Workshop (DSW 2021)","volume":"7 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-10-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"129198880","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 3
PolRoute-DS: um Dataset de Dados Criminais para Geração de Rotas de Patrulhamento Policial PolRoute-DS:用于生成警察巡逻路线的犯罪数据集
Anais do III Dataset Showcase Workshop (DSW 2021) Pub Date : 2021-10-04 DOI: 10.5753/dsw.2021.17420
B. Sá, Gustavo Muller, Maicon Banni, Wagner Santos, Marcos Lage, I. Rosseti, Yuri Frota, Daniel de Oliveira
{"title":"PolRoute-DS: um Dataset de Dados Criminais para Geração de Rotas de Patrulhamento Policial","authors":"B. Sá, Gustavo Muller, Maicon Banni, Wagner Santos, Marcos Lage, I. Rosseti, Yuri Frota, Daniel de Oliveira","doi":"10.5753/dsw.2021.17420","DOIUrl":"https://doi.org/10.5753/dsw.2021.17420","url":null,"abstract":"Esse artigo apresenta o dataset PolRoute-DS, criado para viabilizar o desenvolvimento e testes de abordagens de geração de rotas policiais em centros urbanos. O PolRoute-DS combina a estrutura espacial da cidade de interesse, representada como um grafo conexo e direcionado de segmentos de vias, com dados criminais obtidos de fontes públicas (no contexto deste artigo os dados são providos pela Secretaria da Segurança Pública de São Paulo). O PolRoute-DS se encontra disponível para uso da comunidade sob a licença Creative Commons By Attribution 4.0 International (versões CSV e PostgreSQL), e pode ser obtido em https://osf.io/mxrgu/.","PeriodicalId":314975,"journal":{"name":"Anais do III Dataset Showcase Workshop (DSW 2021)","volume":"4 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-10-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"133841164","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 4
Central de Fatos: Um Repositório de Checagens de Fatos 事实中心:事实检查的存储库
Anais do III Dataset Showcase Workshop (DSW 2021) Pub Date : 2021-10-04 DOI: 10.5753/dsw.2021.17421
J. Couto, Breno Pimenta, Igor M. de Araújo, Samuel Assis, J. C. S. Reis, A. P. C. da Silva, Jussara M. Almeida, Fabrício Benevenuto
{"title":"Central de Fatos: Um Repositório de Checagens de Fatos","authors":"J. Couto, Breno Pimenta, Igor M. de Araújo, Samuel Assis, J. C. S. Reis, A. P. C. da Silva, Jussara M. Almeida, Fabrício Benevenuto","doi":"10.5753/dsw.2021.17421","DOIUrl":"https://doi.org/10.5753/dsw.2021.17421","url":null,"abstract":"Recentemente, o interesse por frentes de pesquisa analisando os mecanismos, bem como maneiras de evitar a disseminação de desinformação aumentou significativamente. Neste cenário, um recorrente obstáculo a indisponibilidade de checagens de fatos. Neste trabalho, compilamos uma extensa coleção de checagens oriundas de importantes agências de checagem de fatos brasileiras. Oferecemos à comunidade cientifica uma coleção inédita contendo checagens de diversas fontes confiáveis que abrangem um largo espectro de tópicos. Ao todo, a coleção resultante engloba 11647 instâncias de checagem de fatos coletadas em 6 agências diferentes que podem ser utilizadas em diversos estudos nos contexos de identificação e combate à desinformaço em plataformas digitais no Brasil.","PeriodicalId":314975,"journal":{"name":"Anais do III Dataset Showcase Workshop (DSW 2021)","volume":"14 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-10-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"125242450","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 5
SAT-ESPEC: Análise e Coleta de Dados da Transmissão de Estações Terrenas de uma Rede Satélite SAT-ESPEC:分析和收集卫星网络地面站传输的数据
Anais do III Dataset Showcase Workshop (DSW 2021) Pub Date : 2021-10-04 DOI: 10.5753/dsw.2021.17413
Josinaldo Azevedo, A. L. C. Barcellos, A. C. Mendes, Daniel de Oliveira, Paulo C. S. Vidal, Marcos V. N. Bedo
{"title":"SAT-ESPEC: Análise e Coleta de Dados da Transmissão de Estações Terrenas de uma Rede Satélite","authors":"Josinaldo Azevedo, A. L. C. Barcellos, A. C. Mendes, Daniel de Oliveira, Paulo C. S. Vidal, Marcos V. N. Bedo","doi":"10.5753/dsw.2021.17413","DOIUrl":"https://doi.org/10.5753/dsw.2021.17413","url":null,"abstract":"As redes de satélites são um complemento essencial para a infraestrutura de telecomunicações no Brasil. Em alguns casos, esta rede é o único meio de comunicação para várias localidades remotas, que são de difícil acesso geográfico. Esse trabalho tem o objetivo de disponibilizar uma base, denominado SAT-ESPEC, construída a partir do espectrograma gerado da recepção dos sinais de cinco estações terrenas, que estão instaladas e em operação na Região Norte do Brasil. Toda a coleta de dados ocorreu numa rede em produção através da Estação de Radiomonitoração e Geolocalização da Agência Nacional de Telecomunicações (ANATEL), que fica no município do Rio de Janeiro. Esse conjunto se encaixa no domínio de propagação de radiofrequência e segurança de rede, e pode ser usado para tarefas como classificação de dados, detecção de anormalidades e análises de séries-temporais.","PeriodicalId":314975,"journal":{"name":"Anais do III Dataset Showcase Workshop (DSW 2021)","volume":"189 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-10-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"114214295","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 1
Covid Data Analytics: Repositório de Dados Provenientes de Múltiplas Fontes sobre a Pandemia de COVID-19 no Brasil Covid -19数据分析:关于巴西Covid -19大流行的多来源数据库
Anais do III Dataset Showcase Workshop (DSW 2021) Pub Date : 2021-08-10 DOI: 10.5753/dsw.2021.17419
P. Moreira, R. Fonseca, Pedro Loures Alzamora, R. S. Franco, J. Guiginski, Evandro L. T. P. Cunha, Tereza Bernardes, Bruno Chagas, Kícila Ferregueti, Luana Passos, Luísa Cardoso, Raquel Schneider, W. Pereira, A. P. C. da Silva, W. Meira Jr.
{"title":"Covid Data Analytics: Repositório de Dados Provenientes de Múltiplas Fontes sobre a Pandemia de COVID-19 no Brasil","authors":"P. Moreira, R. Fonseca, Pedro Loures Alzamora, R. S. Franco, J. Guiginski, Evandro L. T. P. Cunha, Tereza Bernardes, Bruno Chagas, Kícila Ferregueti, Luana Passos, Luísa Cardoso, Raquel Schneider, W. Pereira, A. P. C. da Silva, W. Meira Jr.","doi":"10.5753/dsw.2021.17419","DOIUrl":"https://doi.org/10.5753/dsw.2021.17419","url":null,"abstract":"Este artigo apresenta a construção e publicação de um repositório de dados utilizados e desenvolvidos no âmbito do projeto Covid Data Analytics (CDA), executado pelo Departamento de Ciência da Computação da UFMG. O projeto visou monitorar aspectos referentes à situação social, econômica e epidemiológica da COVID-19 no Brasil a partir da análise de dados provenientes de fontes oficiais e não oficiais, de redes sociais online e da web em geral. A construção do repositório, contendo 18 atributos e 1086 registros, se baseou na coleta direta de dados das fontes selecionadas, os quais foram posteriormente enriquecidos e, finalmente, disponibilizados por meio de uma ferramenta de busca desenvolvida exclusivamente para eles.","PeriodicalId":314975,"journal":{"name":"Anais do III Dataset Showcase Workshop (DSW 2021)","volume":"42 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-08-10","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"123194031","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 2
qFEx - um crawler para busca e extração de questionários de pesquisa em documentos HTML qFEx -一个在HTML文档中搜索和提取调查问卷的爬虫
Anais do III Dataset Showcase Workshop (DSW 2021) Pub Date : 2017-11-06 DOI: 10.5753/dsw.2021.17409
Gilney Nathanael Mathias, C. Dorneles
{"title":"qFEx - um crawler para busca e extração de questionários de pesquisa em documentos HTML","authors":"Gilney Nathanael Mathias, C. Dorneles","doi":"10.5753/dsw.2021.17409","DOIUrl":"https://doi.org/10.5753/dsw.2021.17409","url":null,"abstract":"Questionários de pesquisa podem ser utilizados por empresas ou instituições para avaliar itens ou produtos, mediar a satisfação de seus funcionários/clientes, ou serem utilizados por pesquisadores para coleta de dados que podem ser usados em estudos. Alguns problemas na criação de tais questionários envolvem: decidir quais perguntas fazer, como fazê-las e como organizá-las. Visando isso, este trabalho propõe a criação de um Web Crawler, que varre a Web em busca de sites que possivelmente contenham questionários, e de um Extrator, capaz de extrair os questionários da lista de páginas coletadas pelo crawler e salvá-las em um banco de dados relacional. A base de dados criada pode depois, servir para a análise desses dados e/ou como uma base centralizada de exemplos para a elaboração de novos questionários ou ainda para o reuso de questões existentes. Alguns experimentos são apresentados para demonstrar a correta coleta de questionários pelo crawler, e a posterior extração das questões presentes nos questionários.","PeriodicalId":314975,"journal":{"name":"Anais do III Dataset Showcase Workshop (DSW 2021)","volume":"24 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2017-11-06","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"117114924","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
相关产品
×
本文献相关产品
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信