{"title":"Abordagem analítica para predição e prevenção do Churn","authors":"G. Alves, L. Lima, Lucas da Silva Oliveira","doi":"10.25286/repa.v7i3.2461","DOIUrl":"https://doi.org/10.25286/repa.v7i3.2461","url":null,"abstract":"O Churn, é um termo que se refere a clientes que abandonam uma empresa, este problema é constante no mundo empresarial. Dessa forma se torna necessário o uso de técnicas de análise e tratamento dos dados, para entender e solucionar o processo de Churn numa empresa. A empresa analisada nesta pesquisa foi a Justa, que é uma Fintech brasileira, que proporcionou a base de dados para avaliação e implementação deste estudo. A base disponibilizada contém duas partes: As informações dos clientes em si e as transações deles, nestas foram realizadas etapas de pré-processamento para melhor análise dos dados. Após as etapas de pré-processamento são aplicados técnicas e algoritmos de Machine Learning como: K-means, KNN e Logistic Regression a fim de buscar solucionar o problema de Churn na empresa. Os resultados aqui obtidos mostram que, para o escopo estimado, o projeto consegue dizer se um cliente é churn, com base nas suas transações, mas devido a grande rotatividade de clientes os grupos de clientes analisados não são acentuados e possuem poucos padrões comportamentais. Para uma análise mais elaborada dos perfis de cliente, é necessário obter informações mais detalhadas do cliente, como renda mensal, ocupação, entre outros.","PeriodicalId":331078,"journal":{"name":"Revista de Engenharia e Pesquisa Aplicada","volume":"31 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2022-11-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"129468824","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Guilherme Teixeira Ribeiro de Albuquerque, Gabriel Mac'Hamilton Renaux Alves, A. Maciel
{"title":"Desenvolvimento de um Modelo de Ingestão de Dados para Automl","authors":"Guilherme Teixeira Ribeiro de Albuquerque, Gabriel Mac'Hamilton Renaux Alves, A. Maciel","doi":"10.25286/repa.v7i3.2457","DOIUrl":"https://doi.org/10.25286/repa.v7i3.2457","url":null,"abstract":"A interação entre alunos e professores em Ambientes Virtuais de Aprendizagem (AVA), produzem dados do tipo educacional, que possuem alto potencial de análise, contudo, a extração dessas informações para ferramentas de estudo como as de Aprendizagem de Máquina Automatizada (AutoML), demanda conhecimentos técnicos avançados, que não encontramos em usuários comuns, sendo assim, este trabalho busca adicionar uma nova forma de ingestão das informações em uma ferramenta de AutoML, almejando diminuir a complexidade de um processo de Extração, Transformação e Carga (ETL) dos dados, utilizando a ferramenta Pentaho Data Integration (PDI).","PeriodicalId":331078,"journal":{"name":"Revista de Engenharia e Pesquisa Aplicada","volume":"10 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2022-11-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"114914435","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Allana Lais dos Santos Rocha, Ester Deschamps De Macêdo, Letícia Castro Portela De Oliveira, Vinícius Ferreira Silva
{"title":"Aplicação de Clustering para Segmentação de Clientes na Base de Dados da JUSTA","authors":"Allana Lais dos Santos Rocha, Ester Deschamps De Macêdo, Letícia Castro Portela De Oliveira, Vinícius Ferreira Silva","doi":"10.25286/repa.v7i3.2458","DOIUrl":"https://doi.org/10.25286/repa.v7i3.2458","url":null,"abstract":"Empresas de tecnologia financeira, mais conhecidas como fintechs, são companhias de inovação tecnológica com potencial transformador para o setor financial. Nelas, o tratamento personalizado requer a análise de quantidades expressivas de dados. Dessa forma, utilizar técnicas de mineração de dados pode oferecer maior facilidade em classificar e visualizar os consumidores. A empresa analisada nesse artigo, a Justa, é uma fintech que promove produtos e serviços através de uma conta digital, e que procurava aprimorar a classificação dos seus clientes. A partir das bases de dados anonimizadas, fornecida pela Justa, cada cliente foi representado por features consideradas importantes para a empresa. Para chegar na base final, foi feita a integração, redução, limpeza, e transformação dos dados. Os algoritmos testados para agrupar os clientes foram K-Means, fuzzy C-Means e K-Medoids, onde o K-medoids, aplicado com a distância de Gower, apresentou melhor resultado na delineação dos perfis. Os resultados indicaram que há perfis diferentes de clientes, mas que estes são pouco acentuados e estão concentrados em apenas algumas das características comportamentais.","PeriodicalId":331078,"journal":{"name":"Revista de Engenharia e Pesquisa Aplicada","volume":"37 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2022-11-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"125757065","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Matheus Pinto, Murilo Stodolni, Nilton Vieira da Silva, R. Rocha
{"title":"Categorização de perguntas para SAC Utilizando Mineração de Dados","authors":"Matheus Pinto, Murilo Stodolni, Nilton Vieira da Silva, R. Rocha","doi":"10.25286/repa.v7i3.2449","DOIUrl":"https://doi.org/10.25286/repa.v7i3.2449","url":null,"abstract":"A situação de receber perguntas através de e-mails ou portais desenvolve uma problemática latente que é a falta de tempo para desenvolvimento de respostas em Ouvidorias, sendo este um dos grandes desafios de empresas que insere essa forma de comunicação com seus clientes. O presente artigo tem como objetivo utilizar técnicas de Mineração de Dados para classificar as perguntas recebidas. \u0000No estudo de caso deste artigo, serão utilizadas as técnicas de Mineração de Dados para auxiliar a tomada de decisões de processos administrativos e também a manipulação de um sistema de Perguntas e Respostas frequentes da Secretaria da Controladoria Geral do Estado. Ao final desse artigo, ficará evidente as análises das diversas técnicas utilizadas na construção do sistema, como também os resultados por elas obtidos. Dessa forma, a proposta de uma mudança para um ambiente automatizado poderá auxiliar o fluxo de informações e de execução de tarefas dentro da Controladoria.","PeriodicalId":331078,"journal":{"name":"Revista de Engenharia e Pesquisa Aplicada","volume":"34 26 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2022-11-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"123148405","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Maria Victória Rodrigues Dos Santos, Gabriel Mac'Hamilton Renaux Alves, A. Maciel
{"title":"Benchmarking de Sistemas AutoML Open-source","authors":"Maria Victória Rodrigues Dos Santos, Gabriel Mac'Hamilton Renaux Alves, A. Maciel","doi":"10.25286/repa.v7i3.2456","DOIUrl":"https://doi.org/10.25286/repa.v7i3.2456","url":null,"abstract":"Este estudo propõe comparar três sistemas AutoML (Aprendizado de Máquina Automatizado) de código aberto mais conhecidos, o Auto-WEKA, Auto-Sklearn e TPOT, em termos de funcionamento em cada parte do fluxo de um AutoML, e algoritmos suportados em cada parte desse fluxo. O Aprendizado de Máquina Automatizado é uma ferramenta que automatiza o resultado do aprendizado de máquina com o mínimo de esforço humano possível. Este trabalho mostra que, para determinados tipos de dados e objetivos de previsão, o usuário, seja estudante ou profissional da área de ciência de dados, deve se atentar a cada ferramenta, pois implica nos resultados obtidos e as predições podem ficar mais refinadas ou não.","PeriodicalId":331078,"journal":{"name":"Revista de Engenharia e Pesquisa Aplicada","volume":"56 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2022-11-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"123796431","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Lucas Penteado Lopes da Silva, Luiz Adeildo da Silva Junior, Josafat Marinho Falcão Neto, Geidson Benício Coelho de Souza
{"title":"Aprendizado de Máquina para a Previsão do Comportamento de Preços da Criptomoeda Ethereum","authors":"Lucas Penteado Lopes da Silva, Luiz Adeildo da Silva Junior, Josafat Marinho Falcão Neto, Geidson Benício Coelho de Souza","doi":"10.25286/repa.v7i3.2445","DOIUrl":"https://doi.org/10.25286/repa.v7i3.2445","url":null,"abstract":"Elaboração de algoritmos de aprendizado de máquina para a previsão do comportamento de preços da criptomoeda Ethereum, utilizando-se uma base de dados pública (Kaggle). Os modelos elaborados foram do tipo linear (ARIMA, séries temporais) e nãolinear (três modelos de redes neurais LTSM). Como melhor resultado, verificou-se que um dos modelos não lineares foi capaz de realizar previsões distantes em média de 4,32% dos preços reais.","PeriodicalId":331078,"journal":{"name":"Revista de Engenharia e Pesquisa Aplicada","volume":"52 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2022-11-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"128739259","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
A. Lima, Joel Galdino, Maria Gusmão, Carmelo Bastos-Filho
{"title":"Análise e Diagnóstico das Interrupções Produtivas Em Uma Indústria Automotiva","authors":"A. Lima, Joel Galdino, Maria Gusmão, Carmelo Bastos-Filho","doi":"10.25286/repa.v7i2.2225","DOIUrl":"https://doi.org/10.25286/repa.v7i2.2225","url":null,"abstract":"Reduzir custos e aumentar a produtividade são objetivos comuns entre várias organizações e na indústria automotiva se tornou condição de sobrevivência. Para reduzir o desperdício de determinado recurso, primeiramente devemos identificar onde ele ocorre. O principal objetivo deste trabalho é identificar e dar visibilidade aos fatores relacionados ao tempo perdido com paradas produtivas na linha de produção de uma indústria automotiva. Para isto utilizamos ferramentas de mineração de dados e nos baseamos no CRISP DM. A atividade foi focada no diagnóstico e no levantamento dos perfis das paradas.","PeriodicalId":331078,"journal":{"name":"Revista de Engenharia e Pesquisa Aplicada","volume":"67 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2022-07-17","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"121564091","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
{"title":"Análise do Programa de Extensão Tecnológica de Pernambuco usando Técnicas de Aglomeração de Dados","authors":"V. Freire, C. B. Bastos Filho, E. Rabbani","doi":"10.25286/repa.v7i2.2224","DOIUrl":"https://doi.org/10.25286/repa.v7i2.2224","url":null,"abstract":"A demanda por profissionais relacionados à área de STEM é crescente e foi ainda mais acelerado pela pandemia do COVID-19. No Brasil, o baixo investimento e incentivo à área faz com que se forme menos profissionais em STEM do que a demanda. Em Pernambuco o cenário é ainda mais agravado e, pensando nisso, o governo do estado lançou um programa de extensão tecnológica (PET) com o intuito de incentivar a formação de profissionais na área. Tal programa gerou uma quantidade de dados e, com isso, uma demanda de processamento e estudo destes para que seja possível tanto um entendimento de como o programa está funcionando, como para gerar um melhoramento deste para as próximas rodadas. Assim, foram utilizados algoritmos de aglomeração de dados, como Algoritmo Aglomerativo, k-Modes e Mapas SOM para analisar e gerar resultados a partir dos dados coletados. As métricas utilizadas para avaliar os agrupamentos gerados foram coeficientes de silhueta, pureza e método do cotovelo. Os agrupamentos gerados por estas técnicas mostraram características importantes do programa, além de evidenciar que este está sendo bem avaliado pelos seus beneficiários e, então, cumprindo com seu propósito.","PeriodicalId":331078,"journal":{"name":"Revista de Engenharia e Pesquisa Aplicada","volume":"14 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2022-07-17","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"131324558","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
{"title":"Análise de Incidentes de Data Center através da Aplicação de Técnica de Mineração de Dados","authors":"Samuel Luna Martins, C. B. Bastos Filho","doi":"10.25286/repa.v7i2.2221","DOIUrl":"https://doi.org/10.25286/repa.v7i2.2221","url":null,"abstract":"Esse trabalho tem como objetivo aplicar a técnica de agrupamento K-Modes a fim de auxiliar na identificação das causas-raízes dos problemas de disponibilidade e desempenho de serviços e sistemas hospedados em servidores e máquinas virtuais de um Data Center de uma organização. Os dados foram extraídos a partir da ferramenta de monitoramento chamada Zabbix relativos aos últimos 3 meses de incidentes. Foi realizado um procedimento de pré-processamento dos dados, extraindo os atributos mais relevantes, posteriormente foi aplicada a técnica chamada K-Modes juntamente com o valor de K mais adequado encontrado a partir do método Elbow. Após análise de dados, foi possível extrair regras de correlação e criar um plano estratégico a fim de mitigar a quantidade de incidentes recorrentes.","PeriodicalId":331078,"journal":{"name":"Revista de Engenharia e Pesquisa Aplicada","volume":"10 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2022-07-17","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"127060095","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Fernando A. R. Finardi, C. E. Fernandes, Fernando L. Amadeu, Maria G. Valus, B. T. Fernandes
{"title":"Inspeção e Classificação de Defeitos de Componentes nas Pcis Aplicando Técnicas de Deep Learning","authors":"Fernando A. R. Finardi, C. E. Fernandes, Fernando L. Amadeu, Maria G. Valus, B. T. Fernandes","doi":"10.25286/repa.v7i2.2220","DOIUrl":"https://doi.org/10.25286/repa.v7i2.2220","url":null,"abstract":"A Placa de Circuito Impresso (PCI) é praticamente usada em todos os produtos eletrônicos que usamos no cotidiano, quer seja para fins comerciais ou em outras aplicações tecnológicas. Devido a relevância da aplicação, as PCIs, após o processo de montagem de componentes, necessitam de um sistema de inspeção e localização de defeitos na montagem para garantir a qualidade das suas aplicações. A montagem de um componente da placa de forma errônea pode causar falhas significativas na etapa final do produto. Para classificar os defeitos dos componentes gerados artificialmente das PCIs de referência foi aplicado o algoritmo baseado nas redes neurais convolucionais (CNNs). E os resultados indicaram que o algoritmo aplicado pode ser utilizado na inspeção e classificação de defeitos em PCIs para um sistema de baixo custo.","PeriodicalId":331078,"journal":{"name":"Revista de Engenharia e Pesquisa Aplicada","volume":"15 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2022-07-17","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"131635629","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}