{"title":"AutoRL-TSP RSM:求解旅行商问题的响应面方法的自动强化学习系统","authors":"Gleice Kelly Barbosa Souza, A. L. C. Ottoni","doi":"10.5335/rbca.v13i3.12653","DOIUrl":null,"url":null,"abstract":"A definição de parâmetros é uma importante etapa para a utilização de métodos de Aprendizado de Máquina. No entanto, pode ser altamente custoso definir esses valores de condições iniciais para cada aplicação. Assim, este trabalho tem como objetivo propor um sistema de Aprendizado de Máquina Automatizado para ajuste de parâmetros. Nesta linha, foi desenvolvido um método de Aprendizado por Reforço Automatizado aplicado ao Problema do Caixeiro Viajante. O sistema proposto ajustou através da Metodologia de Superfície de Resposta dois parâmetros (taxa de aprendizado e fator de desconto) do algoritmo Q-learning. Os resultados revelaram que os valores ajustados pelo método proposto alcançaram, em geral, as melhores soluções, em comparação com a adoção de parâmetros da literatura.","PeriodicalId":41711,"journal":{"name":"Revista Brasileira de Computacao Aplicada","volume":null,"pages":null},"PeriodicalIF":0.2000,"publicationDate":"2021-11-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"1","resultStr":"{\"title\":\"AutoRL-TSP-RSM: sistema de aprendizado por reforço automatizado com metodologia de superfície de resposta para o problema do caixeiro viajante\",\"authors\":\"Gleice Kelly Barbosa Souza, A. L. C. Ottoni\",\"doi\":\"10.5335/rbca.v13i3.12653\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"A definição de parâmetros é uma importante etapa para a utilização de métodos de Aprendizado de Máquina. No entanto, pode ser altamente custoso definir esses valores de condições iniciais para cada aplicação. Assim, este trabalho tem como objetivo propor um sistema de Aprendizado de Máquina Automatizado para ajuste de parâmetros. Nesta linha, foi desenvolvido um método de Aprendizado por Reforço Automatizado aplicado ao Problema do Caixeiro Viajante. O sistema proposto ajustou através da Metodologia de Superfície de Resposta dois parâmetros (taxa de aprendizado e fator de desconto) do algoritmo Q-learning. Os resultados revelaram que os valores ajustados pelo método proposto alcançaram, em geral, as melhores soluções, em comparação com a adoção de parâmetros da literatura.\",\"PeriodicalId\":41711,\"journal\":{\"name\":\"Revista Brasileira de Computacao Aplicada\",\"volume\":null,\"pages\":null},\"PeriodicalIF\":0.2000,\"publicationDate\":\"2021-11-29\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"1\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Revista Brasileira de Computacao Aplicada\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.5335/rbca.v13i3.12653\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"Q4\",\"JCRName\":\"COMPUTER SCIENCE, INTERDISCIPLINARY APPLICATIONS\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Revista Brasileira de Computacao Aplicada","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5335/rbca.v13i3.12653","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q4","JCRName":"COMPUTER SCIENCE, INTERDISCIPLINARY APPLICATIONS","Score":null,"Total":0}
AutoRL-TSP-RSM: sistema de aprendizado por reforço automatizado com metodologia de superfície de resposta para o problema do caixeiro viajante
A definição de parâmetros é uma importante etapa para a utilização de métodos de Aprendizado de Máquina. No entanto, pode ser altamente custoso definir esses valores de condições iniciais para cada aplicação. Assim, este trabalho tem como objetivo propor um sistema de Aprendizado de Máquina Automatizado para ajuste de parâmetros. Nesta linha, foi desenvolvido um método de Aprendizado por Reforço Automatizado aplicado ao Problema do Caixeiro Viajante. O sistema proposto ajustou através da Metodologia de Superfície de Resposta dois parâmetros (taxa de aprendizado e fator de desconto) do algoritmo Q-learning. Os resultados revelaram que os valores ajustados pelo método proposto alcançaram, em geral, as melhores soluções, em comparação com a adoção de parâmetros da literatura.