「微调已死」再添筹码,谷歌扩展AI自我进化范式,成功经验与失败教训双向学习
学术头条
2025-10-13 16:00
文章摘要
本文介绍了谷歌提出的ReasoningBank框架,该框架通过构建结构化记忆系统实现智能体的自我进化。研究背景源于传统微调方法的局限性,提出无需真实标签即可从成功与失败经验中双向学习的创新方案。研究目的在于通过记忆检索、构建与整合的闭环机制,结合记忆感知测试时扩展(MaTTS)技术,提升智能体在复杂任务中的决策能力。实验结果表明,在网页浏览和软件工程任务中,该方法在效果上最高提升34.2%,效率上减少16%交互步骤,验证了经验扩展与记忆系统的协同效应。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。