不好!1930年的AI都来抢程序员饭碗了
计算材料学
2026-05-05 14:40
文章摘要
本文介绍了一项关于1930年知识模型“talkie-1930-13b”的实验。该模型仅接受1931年1月1日以前的数据训练,但通过微调后,它能够解决现代软件工程问题,例如为xarray库打补丁。实验采用SWE-bench基准测试,仅用250个训练样本,模型便成功完成第一个修复任务。当训练数据扩展到约75K条轨迹(10亿token)时,模型在SWE-bench-Verified上达到4.5%的pass@1,与其互联网预训练的兄弟模型相比仅差1个百分点。团队已开源项目。研究旨在探讨智能的本质,挑战了“AI需要大量互联网数据才能变聪明”的普遍认知,暗示预训练数据量可能并非智能的关键瓶颈。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。