Talita Albuquerque de Araújo, Jairson Barbosa Rodrigues
{"title":"Utilização de Dataflow para previsão de aceitação de respostas no fórum StackOverflow.com","authors":"Talita Albuquerque de Araújo, Jairson Barbosa Rodrigues","doi":"10.25286/REPA.V3I3.942","DOIUrl":null,"url":null,"abstract":"A era digital que estamos vivendo atualmente proporcionou grandes benefícios para a sociedade, fornecendo máquinas capazes de realizar, com alta velocidade, milhares de cálculos. À medida que evoluíam, os dispositivos ficavam cada vez mais robustos, suportando cargas elevadas de informações. A melhoria dos recursos computacionais, e da possibilidade de armazenar uma maior quantidade de dados, além do processamento de uma simples máquina, aumenta o nível de complexidade dos dispositivos, ou seja, um simples computador deverá estar em constante evolução para atender às necessidades atuais da sociedade. Uma grande dificuldade que vale ressaltar é a necessidade de processar dados em larga escala, sendo, por isso, necessária a utilização de sistemas de alto desempenho para esse processamento. Assim, o objetivo deste artigo é mostrar um framework que permita que seja desempenhada essa função de forma rápida e simples, tirando proveito da estrutura do DataFlow para processamento de Big Data. A análise realizada é do tipo preditiva, em uma base disponibilizada on-line. A partir dela, será mostrado o uso do framework e se procurará verificar se o modelo gerado teve sucesso ou não. Os indicadores usados para essa comprovação serão a acurácia, a curva ROC, a especificidade e a sensitividade. Como resultado, espera-se extrair conhecimento sobre a aplicação do framework DataFlow para análise de grandes quantidades de dados e mostrar algumas vantagens no seu uso prático.","PeriodicalId":331078,"journal":{"name":"Revista de Engenharia e Pesquisa Aplicada","volume":"63 6 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2018-08-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Revista de Engenharia e Pesquisa Aplicada","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.25286/REPA.V3I3.942","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
A era digital que estamos vivendo atualmente proporcionou grandes benefícios para a sociedade, fornecendo máquinas capazes de realizar, com alta velocidade, milhares de cálculos. À medida que evoluíam, os dispositivos ficavam cada vez mais robustos, suportando cargas elevadas de informações. A melhoria dos recursos computacionais, e da possibilidade de armazenar uma maior quantidade de dados, além do processamento de uma simples máquina, aumenta o nível de complexidade dos dispositivos, ou seja, um simples computador deverá estar em constante evolução para atender às necessidades atuais da sociedade. Uma grande dificuldade que vale ressaltar é a necessidade de processar dados em larga escala, sendo, por isso, necessária a utilização de sistemas de alto desempenho para esse processamento. Assim, o objetivo deste artigo é mostrar um framework que permita que seja desempenhada essa função de forma rápida e simples, tirando proveito da estrutura do DataFlow para processamento de Big Data. A análise realizada é do tipo preditiva, em uma base disponibilizada on-line. A partir dela, será mostrado o uso do framework e se procurará verificar se o modelo gerado teve sucesso ou não. Os indicadores usados para essa comprovação serão a acurácia, a curva ROC, a especificidade e a sensitividade. Como resultado, espera-se extrair conhecimento sobre a aplicação do framework DataFlow para análise de grandes quantidades de dados e mostrar algumas vantagens no seu uso prático.