求解c型环形耐心立方体规划问题

Ji-Hyeon Yoo, Ho-Jin Jung, Janghyeon Kim, Dae-Han Sim, Song-Woo Kim, KwangEun Ko, Han Ul Yoon
{"title":"求解c型环形耐心立方体规划问题","authors":"Ji-Hyeon Yoo, Ho-Jin Jung, Janghyeon Kim, Dae-Han Sim, Song-Woo Kim, KwangEun Ko, Han Ul Yoon","doi":"10.5391/jkiis.2023.33.5.477","DOIUrl":null,"url":null,"abstract":"정확한 힘과 방향을 요구하는 작업이 주어졌을 때, 사람은 강화학습과 유사한 휴리스틱 방법론을 통해 작업을 수행한다. 따라서, 이러한 사람의 의사결정-조작의 과정을 강화학습으로 구현하여 로봇에게 적용하여준다면 정교한 손동작이 요구되는 작업을 성공적으로 수행할 수 있을 것으로 기대할 수 있다. 본 논문은 사람의 정교한 손놀림이 요구되는 C형 고리 patience cube를 로봇으로 해결하기 위한 강화학습 기반 플래너 설계 기법을 제안한다. 먼저 두 축을 기준으로 회전하는 평평한 판과 그 위에서 구르는 공에 대한 운동 방정식을 구하였다. 이후, C형 고리 patience cube 문제를 C형 고리의 입구로 공을 가져오는 플래닝 문제와 그 영역으로부터 공을 고리 안으로 넣는 플래닝 문제로 구성하였다. 이어서, 각 플래닝 문제를 해결하기 위한 마르코프 의사 결정(MDP) 튜플(상태, 행동, 보상)을 정의하였다. 에이전트(플래너)는 가상환경에서 강화학습 알고리즘(PPO)을 통해 학습되었다. 결과적으로, 가상환경에서 학습된 에이전트가 가상환경에서 C형 고리 patience cube문제를 잘 해결할 수 있음을 확인하였다. 또한, 실제 환경의 양팔 로봇에 이식하였을 때도 주어진 C형 고리 patience cube 문제를 해결할 수 있음을 확인하였다. 이를 통해, 본 논문에서 제안된 방법론으로, 다양한 정교한 손동작 문제를 kinodynamic 플래닝 문제로 정의하여 해결할 수 있는 가능성을 보였다.","PeriodicalId":17349,"journal":{"name":"Journal of The Korean Institute of Intelligent Systems","volume":null,"pages":null},"PeriodicalIF":0.0000,"publicationDate":"2023-10-31","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Solving the C-Shaped Ring Type Patience Cube as Planning Problem\",\"authors\":\"Ji-Hyeon Yoo, Ho-Jin Jung, Janghyeon Kim, Dae-Han Sim, Song-Woo Kim, KwangEun Ko, Han Ul Yoon\",\"doi\":\"10.5391/jkiis.2023.33.5.477\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"정확한 힘과 방향을 요구하는 작업이 주어졌을 때, 사람은 강화학습과 유사한 휴리스틱 방법론을 통해 작업을 수행한다. 따라서, 이러한 사람의 의사결정-조작의 과정을 강화학습으로 구현하여 로봇에게 적용하여준다면 정교한 손동작이 요구되는 작업을 성공적으로 수행할 수 있을 것으로 기대할 수 있다. 본 논문은 사람의 정교한 손놀림이 요구되는 C형 고리 patience cube를 로봇으로 해결하기 위한 강화학습 기반 플래너 설계 기법을 제안한다. 먼저 두 축을 기준으로 회전하는 평평한 판과 그 위에서 구르는 공에 대한 운동 방정식을 구하였다. 이후, C형 고리 patience cube 문제를 C형 고리의 입구로 공을 가져오는 플래닝 문제와 그 영역으로부터 공을 고리 안으로 넣는 플래닝 문제로 구성하였다. 이어서, 각 플래닝 문제를 해결하기 위한 마르코프 의사 결정(MDP) 튜플(상태, 행동, 보상)을 정의하였다. 에이전트(플래너)는 가상환경에서 강화학습 알고리즘(PPO)을 통해 학습되었다. 결과적으로, 가상환경에서 학습된 에이전트가 가상환경에서 C형 고리 patience cube문제를 잘 해결할 수 있음을 확인하였다. 또한, 실제 환경의 양팔 로봇에 이식하였을 때도 주어진 C형 고리 patience cube 문제를 해결할 수 있음을 확인하였다. 이를 통해, 본 논문에서 제안된 방법론으로, 다양한 정교한 손동작 문제를 kinodynamic 플래닝 문제로 정의하여 해결할 수 있는 가능성을 보였다.\",\"PeriodicalId\":17349,\"journal\":{\"name\":\"Journal of The Korean Institute of Intelligent Systems\",\"volume\":null,\"pages\":null},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2023-10-31\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Journal of The Korean Institute of Intelligent Systems\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.5391/jkiis.2023.33.5.477\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Journal of The Korean Institute of Intelligent Systems","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5391/jkiis.2023.33.5.477","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

摘要

当被赋予要求正确的力量和方向的工作时,人就会通过类似强化学习的启发方法论来完成工作。因此,如果将这种人的决策-操作过程体现为强化学习,并应用于机器人,就可以期待成功完成需要精巧手动作的工作。本论文提出了用机器人解决需要人精巧手法的C型环patience cube的强化学习基础规划设计技法。首先求出以两个轴为基准旋转的平坦板和在上面滚动的球的运动方程。此后,C型环patience cube问题由将球从C型环入口引到球的规划问题和将球从该区域引到环内的规划问题组成。随后,他定义了马尔科夫决策(MDP)协调(状态、行动和补偿)来解决每个规划问题。经纪人(planner)是在虚拟环境中通过强化学习算法(PPO)学习的。结果,在虚拟环境中学习的代理可以很好地解决虚拟环境中的C型环patience cube问题。此外,移植到实际环境中的双臂机器人中,也可以解决C型环patience cube问题。通过这篇论文提出的方法论,可以将各种精巧的手部动作问题定义为kinodynamic规划问题来解决。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
Solving the C-Shaped Ring Type Patience Cube as Planning Problem
정확한 힘과 방향을 요구하는 작업이 주어졌을 때, 사람은 강화학습과 유사한 휴리스틱 방법론을 통해 작업을 수행한다. 따라서, 이러한 사람의 의사결정-조작의 과정을 강화학습으로 구현하여 로봇에게 적용하여준다면 정교한 손동작이 요구되는 작업을 성공적으로 수행할 수 있을 것으로 기대할 수 있다. 본 논문은 사람의 정교한 손놀림이 요구되는 C형 고리 patience cube를 로봇으로 해결하기 위한 강화학습 기반 플래너 설계 기법을 제안한다. 먼저 두 축을 기준으로 회전하는 평평한 판과 그 위에서 구르는 공에 대한 운동 방정식을 구하였다. 이후, C형 고리 patience cube 문제를 C형 고리의 입구로 공을 가져오는 플래닝 문제와 그 영역으로부터 공을 고리 안으로 넣는 플래닝 문제로 구성하였다. 이어서, 각 플래닝 문제를 해결하기 위한 마르코프 의사 결정(MDP) 튜플(상태, 행동, 보상)을 정의하였다. 에이전트(플래너)는 가상환경에서 강화학습 알고리즘(PPO)을 통해 학습되었다. 결과적으로, 가상환경에서 학습된 에이전트가 가상환경에서 C형 고리 patience cube문제를 잘 해결할 수 있음을 확인하였다. 또한, 실제 환경의 양팔 로봇에 이식하였을 때도 주어진 C형 고리 patience cube 문제를 해결할 수 있음을 확인하였다. 이를 통해, 본 논문에서 제안된 방법론으로, 다양한 정교한 손동작 문제를 kinodynamic 플래닝 문제로 정의하여 해결할 수 있는 가능성을 보였다.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信