DeepMind:乒乓球agent的一小拍,自主学习机器人的一大步
学术头条
2025-07-23 16:00
文章摘要
本文探讨了如何通过自主学习和适应性训练提升机器人性能,减少对人类干预的依赖。研究背景在于传统机器人控制需要大量专家编程和参数调整,而机器学习虽具潜力但仍需大量人工监督。研究目的是通过让两个机器人智能体在对抗环境中自我提升,探索更自主的学习方法。选择乒乓球作为测试平台,因其动态环境能体现机器人技术的挑战。研究结论表明,通过竞争性对战和视觉语言模型(VLM)作为教练,机器人能逐步提升技能,达到业余人类水平,但仍需解决稳定性和扩展性等挑战。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。