清华李涓子团队:让推理模型学会何时思考;上海AI Lab提出“视觉代理强化微调”|大模型论文
学术头条
2025-05-25 10:00
文章摘要
本文介绍了多个研究团队在大模型领域的最新研究成果。清华李涓子团队提出了AdaptThink算法,使推理模型能根据问题难度自适应选择思考模式,显著降低推理成本并提高性能。上海AI Lab提出了视觉代理强化微调(Visual-ARFT)方法,增强了大型视觉语言模型的多模态代理能力。微软团队推出了大型混合推理模型(LHRM)和奖励推理模型(RRM),分别优化了推理效率和奖励建模性能。此外,联发科提出的潜流Transformer(LFT)和斯坦福的通用用户模型(GUM)架构也展示了在模型压缩和用户理解方面的创新。这些研究共同推动了人工智能在推理、多模态处理和用户建模等领域的发展。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。