刚刚,MindLab开源V1系列模型Preview,749B参数,专为Agent后训练
机器学习算法与自然语言处理
2026-06-09 00:00
文章摘要
本文介绍了Mind Lab最新开源的Macaron-V1-Preview模型,该模型拥有749B参数,专为Agent场景进行深度后训练。研究背景是当前大模型后训练成为能力提升关键,而Agent任务需要模型具备真实任务执行、工具调用和持续学习能力。研究目的是开源一个面向真实Agent任务的高效模型,验证以强化学习和LoRA为核心的后训练范式。结论表明,Macaron-V1-Preview在LivingBench、VitaBench等生活任务和A2UI等交互评测中取得SOTA,在数学、代码等通用任务上比肩头部开源模型。其创新在于整合了Mixture-of-LoRA架构,支持大规模持续学习,并能在不到300张GPU(部分非最新型号)上完成训练,算力成本低于同尺寸模型的1%。模型已开源在Hugging Face,技术报告可在官网获取。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。