停止RL研究!前OpenAI研究员:互联网才是唯一重要的技术
学术头条
2025-07-15 16:51
文章摘要
本文由前OpenAI研究员Kevin Lu撰写,核心观点是互联网而非强化学习(RL)或transformer架构,才是推动人工智能(AI)发展的关键技术。作者认为,当前RL研究缺乏通用数据源,难以实现重大突破,而互联网作为多样化、星球级规模的数据源,为AI模型提供了丰富的监督信息和自然课程设置。文章从背景、研究目的和结论三个角度展开:背景方面,指出AI社区过度关注架构创新(如transformer),忽视了数据的根本瓶颈;研究目的上,主张研究人员应转向研究互联网及其数据特性,而非优化RL算法;结论部分强调,互联网与“下一个token预测”范式形成完美互补,而RL的未来取决于找到类似互联网的“对偶”数据源——具备多样性、课程性和产品化潜力的系统。文中还通过教科书、对齐数据等案例,说明互联网数据的不可替代性,并探讨了RL可能的应用方向(如机器人、推荐系统)及其局限性。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。