发布求助

文献互助智能选刊最新文献

刚刚，MindLab开源V1系列模型Preview，749B参数，专为Agent后训练

机器学习算法与自然语言处理 2026-06-09 00:00

文章摘要

本文介绍了Mind Lab最新开源的Macaron-V1-Preview模型，该模型拥有749B参数，专为Agent场景进行深度后训练。研究背景是当前大模型后训练成为能力提升关键，而Agent任务需要模型具备真实任务执行、工具调用和持续学习能力。研究目的是开源一个面向真实Agent任务的高效模型，验证以强化学习和LoRA为核心的后训练范式。结论表明，Macaron-V1-Preview在LivingBench、VitaBench等生活任务和A2UI等交互评测中取得SOTA，在数学、代码等通用任务上比肩头部开源模型。其创新在于整合了Mixture-of-LoRA架构，支持大规模持续学习，并能在不到300张GPU（部分非最新型号）上完成训练，算力成本低于同尺寸模型的1%。模型已开源在Hugging Face，技术报告可在官网获取。

刚刚，MindLab开源V1系列模型Preview，749B参数，专为Agent后训练

本站注明稿件来源为其他媒体的文/图等稿件均为转载稿，本站转载出于非商业性的教育和科研之目的，并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题，请作者速来电或来函联系。

机器学习算法与自然语言处理

今夜，库克终极绝唱！25亿苹果设备用AI重生

今夜，库克终极绝唱！25亿苹果设备用AI重生. 22小时前

代码真能让大模型更会推理吗？我们重新看了一组实验

代码真能让大模型更会推理吗？我们重新看了一组实验. 22小时前

刚刚，Anthropic首个神话级Claude5正式解禁！

刚刚，Anthropic首个神话级Claude5正式解禁！. 22小时前

马斯克39页SpaceX计划，人类史上最伟大的PPT

马斯克39页SpaceX计划，人类史上最伟大的PPT. 2026-06-08

浙大×阿里云首发Token经济学综述：重估LLMAgent的Token世界

浙大×阿里云首发Token经济学综述：重估LLMAgent的Token世界. 2026-06-08

最新文章

刚刚，Anthropic首个神话级Claude5正式解禁！

刚刚，Anthropic首个神话级Claude5正式解禁！ 22小时前

代码真能让大模型更会推理吗？我们重新看了一组实验

代码真能让大模型更会推理吗？我们重新看了一组实验 22小时前

今夜，库克终极绝唱！25亿苹果设备用AI重生

今夜，库克终极绝唱！25亿苹果设备用AI重生 22小时前

深入解析LLM推理中的DecodeBatch内部负载不均问题

深入解析LLM推理中的DecodeBatch内部负载不均问题 2026-06-08

热门类别

综合性期刊物理法学地球科学历史学

相关文章

中科院亚热带生态所李德军团队在 Microorganisms 发文，揭示一种新型生物有机肥在甘蔗增产抑病中的巨大潜力江桂斌院士、傅建捷研究员团队WR｜整合靶标、疑似靶标和非靶标分析揭示大型饮用水源地中苯并三唑类紫外线稳定剂的赋存特征与环境风险同济大学“化学”学科稳居ESI全球前0.537‰顶尖行列 Immunity综述｜许琛琦/杨魏/王广川团队系统总结免疫细胞胆固醇代谢的分子机制与治疗机遇 One Earth | 张福锁院士团队提出“食物—微生物纽带”新框架推动食物系统营养健康与可持续转型

联系我们：info@booksci.cn Book学术提供免费学术资源搜索服务，方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1

京公网安备 11010802042870号

Book学术文献互助

Book学术文献互助群
群号：604180095

Book学术官方微信

小红书