清华李涓子团队:让推理模型学会何时思考;上海AI Lab提出“视觉代理强化微调”|大模型论文

学术头条 2025-05-25 10:00
文章摘要
本文介绍了多个研究团队在大模型领域的最新研究成果。清华李涓子团队提出了AdaptThink算法,使推理模型能根据问题难度自适应选择思考模式,显著降低推理成本并提高性能。上海AI Lab提出了视觉代理强化微调(Visual-ARFT)方法,增强了大型视觉语言模型的多模态代理能力。微软团队推出了大型混合推理模型(LHRM)和奖励推理模型(RRM),分别优化了推理效率和奖励建模性能。此外,联发科提出的潜流Transformer(LFT)和斯坦福的通用用户模型(GUM)架构也展示了在模型压缩和用户理解方面的创新。这些研究共同推动了人工智能在推理、多模态处理和用户建模等领域的发展。
清华李涓子团队:让推理模型学会何时思考;上海AI Lab提出“视觉代理强化微调”|大模型论文
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。
学术头条
最新文章
热门类别
相关文章
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信