Pemanfaatan Asynchronous Advantage Actor-Critic Dalam Pembuatan AI Game Bot Pada Game Arcade

Journal of Intelligent System and Computation Pub Date : 2019-12-05 DOI:10.52985/insyst.v1i2.82

Evan Kusuma Susanto, Yosi Kristian

引用次数: 0

Abstract

Asynchronous Advantage Actor-Critic (A3C) adalah sebuah algoritma deep reinforcement learning yang dikembangkan oleh Google DeepMind. Algoritma ini dapat digunakan untuk menciptakan sebuah arsitektur artificial intelligence yang dapat menguasai berbagai jenis game yang berbeda melalui trial and error dengan mempelajari tempilan layar game dan skor yang diperoleh dari hasil tindakannya tanpa campur tangan manusia. Sebuah network A3C terdiri dari Convolutional Neural Network (CNN) di bagian depan, Long Short-Term Memory Network (LSTM) di tengah, dan sebuah Actor-Critic network di bagian belakang. CNN berguna sebagai perangkum dari citra output layar dengan mengekstrak fitur-fitur yang penting yang terdapat pada layar. LSTM berguna sebagai pengingat keadaan game sebelumnya. Actor-Critic Network berguna untuk menentukan tindakan terbaik untuk dilakukan ketika dihadapkan dengan suatu kondisi tertentu. Dari hasil percobaan yang dilakukan, metode ini cukup efektif dan dapat mengalahkan pemain pemula dalam memainkan 5 game yang digunakan sebagai bahan uji coba.

查看原文本刊更多论文

Pemanfaatan异步优势演员评论家Dalam Pembuatan AI Game Bot Pada Game Arcade

回溯高级技术(A3C)是谷歌DeepMind开发的深度信息学习算法。这个算法可以用来创建一个人工智能架构，通过研究他的游戏屏幕模板和从他的行为中获得的分数，通过测试和错误来控制不同类型的游戏。A3C网络由前方的神经通路网络(CNN)、中间的Long Short-Term内存网络(LSTM)和后面的“critic网络”组成。CNN很有用，可以从屏幕输出图像中提取重要的功能。LSTM有助于提醒我们以前的游戏状态。批评家网络可以帮助决定在面对特定情况时采取的最佳行动。从实验结果来看，这种方法非常有效，可以在用作测试材料的5款游戏中击败新手玩家。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊

Journal of Intelligent System and Computation

自引率

0.00%

发文量