Aprendizado por Reforço e Jogos: uma proposta focada na análise de algoritmos

IF 0.1 Q4 COMPUTER SCIENCE, INTERDISCIPLINARY APPLICATIONS

Revista Brasileira de Computacao Aplicada Pub Date : 2022-07-10 DOI:10.5335/rbca.v14i2.12500

Diego Costa, Giancarlo Lucca, D. Adamatti

引用次数: 0

Abstract

O mercado de jogos movimenta bilhões de dólares por ano e está crescendo exponencialmente. O aprendizado por reforço é uma técnica de tentativa e erro que está diretamente relacionada a esse mercado. Assim, o estudo dessas técnicas em jogos populares torna-se relevante, como o estudo de caso deste projeto, o jogo Pac-man. Este trabalho tem como objetivo utilizar métricas para validar os resultados obtidos na simulação de algoritmos de aprendizado por reforço e sua validação baseada em algumas métricas, como recompensadas ganhas pelo agente, a exploração do ambiente, sua completude e o tempo de cada simulação. Vários testes foram realizados com cada algoritmo testado e os resultados demonstram que para ambientes com comportamentos com imprevisibilidade, o aprendizado por reforço tende a demorar muito a convergir.

查看原文本刊更多论文

强化学习和游戏:一种专注于算法分析的建议

游戏市场每年移动数十亿美元，并呈指数级增长。强化学习是一种与市场直接相关的反复试验技术。因此，这些技术在流行游戏中的研究变得相关，如这个项目的案例研究，游戏吃豆人。这项工作的目的是使用指标来验证强化学习算法模拟的结果，并基于一些指标进行验证，如代理获得的奖励、环境的探索、其完整性和每次模拟的时间。对每种算法进行了多次测试，结果表明，对于行为不可预测的环境，强化学习往往需要很长时间才能收敛。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊

Revista Brasileira de Computacao Aplicada COMPUTER SCIENCE, INTERDISCIPLINARY APPLICATIONS-

自引率

50.00%

发文量