Otávio Oliveira, Henrique L. V. Giuliani, Amanda Polastro, Denis G. Fantinato
{"title":"Um Critério Baseado no Casamento de Distribuições Multivariadas para o Treinamento de Redes LSTM","authors":"Otávio Oliveira, Henrique L. V. Giuliani, Amanda Polastro, Denis G. Fantinato","doi":"10.21528/cbic2019-124","DOIUrl":null,"url":null,"abstract":"Resumo—Em problemas de predição de séries temporais, as Redes Neurais Recorrentes (RNNs, do inglês Recurrent Neural Networks) despontam como importantes estruturas de processamento de informação. Em particular, as RNNs do tipo LSTM (do inglês Long Short-Term Memory) possuem distintos mecanismos para tratar concomitantemente memórias de curto e de longo prazo, o que lhes garante um enorme potencial para o tratamento da informação. No entanto, o uso do erro quadrático médio (MSE, do inglês Mean Squared Error) como critério de otimização pode trazer algumas limitações ao desempenho da LSTM. Nesse sentido, o presente trabalho propõe o uso de um critério baseado no casamento de distribuições multivariadas ao invés do MSE para o treinamento da LSTM. Os resultados envolvendo quatro diferentes datasets para predição são favoráveis a esta abordagem que abre novas perspectivas para o uso da LSTM. Keywords—Redes Neurais Recorrentes; LSTM; Casamento de PDF","PeriodicalId":160474,"journal":{"name":"Anais do 14. Congresso Brasileiro de Inteligência Computacional","volume":"12 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2020-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Anais do 14. Congresso Brasileiro de Inteligência Computacional","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.21528/cbic2019-124","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
Resumo—Em problemas de predição de séries temporais, as Redes Neurais Recorrentes (RNNs, do inglês Recurrent Neural Networks) despontam como importantes estruturas de processamento de informação. Em particular, as RNNs do tipo LSTM (do inglês Long Short-Term Memory) possuem distintos mecanismos para tratar concomitantemente memórias de curto e de longo prazo, o que lhes garante um enorme potencial para o tratamento da informação. No entanto, o uso do erro quadrático médio (MSE, do inglês Mean Squared Error) como critério de otimização pode trazer algumas limitações ao desempenho da LSTM. Nesse sentido, o presente trabalho propõe o uso de um critério baseado no casamento de distribuições multivariadas ao invés do MSE para o treinamento da LSTM. Os resultados envolvendo quatro diferentes datasets para predição são favoráveis a esta abordagem que abre novas perspectivas para o uso da LSTM. Keywords—Redes Neurais Recorrentes; LSTM; Casamento de PDF