发布求助

文献互助智能选刊最新文献

入选ECCV2026！清华开源空间模型打败Gemini：真正的空间智能是在世界变化中持续学习

机器学习算法与自然语言处理 2026-06-23 00:00

文章摘要

本文由清华大学博士生刘芳甫等研究者提出Spatial-TTT模型，该工作被计算机视觉顶会ECCV 2026接收，旨在解决多模态模型在动态真实世界中从“看懂画面”到“理解空间”的核心问题。研究背景是：在机器人、自动驾驶等场景中，空间信息分散于长时间视频流中，模型需持续更新记忆而非一次性处理。研究目的是：使模型在推理过程中边看视频边更新内部参数，形成并维护动态的3D空间记忆，突破传统方法依赖长上下文的局限。结论是：仅2B参数的Spatial-TTT在多项空间智能基准上超越GPT-5、Gemini-3-pro等闭源模型，可处理最长120分钟流式视频。其创新包括混合式TTT架构（75%TTT层负责长程记忆，25%全注意力层维持语义理解）、空间预测机制（在Q/K/V中引入3D时空卷积捕捉几何连续性）以及稠密场景描述监督（训练模型维护全局3D记忆）。实验表明，Spatial-TTT在VSI-Bench、MindCube-Tiny等基准上表现优异，同时实现超40%的显存与计算节省，为Physical Agent的持续世界状态建模提供了新路径。

入选ECCV2026！清华开源空间模型打败Gemini：真正的空间智能是在世界变化中持续学习

本站注明稿件来源为其他媒体的文/图等稿件均为转载稿，本站转载出于非商业性的教育和科研之目的，并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题，请作者速来电或来函联系。

机器学习算法与自然语言处理

浙江大学、香港中文大学（深圳）、香港理工大学、北京航空航天大学等知名学者重磅来袭！

浙江大学、香港中文大学（深圳）、香港理工大学、北京航空航天大学等知名学者重磅来袭！. 15小时前

LeCun、谢赛宁转发的世界模型与VLA共融方案：中关村学院ECCV2026—VLA-JEPA

LeCun、谢赛宁转发的世界模型与VLA共融方案：中关村学院ECCV2026—VLA-JEPA. 15小时前

一次吃下一本书！百度开源新OCR，作者疑似前DeepSeek研究员

一次吃下一本书！百度开源新OCR，作者疑似前DeepSeek研究员. 15小时前

GAIRPaper104｜Agent真的能自我进化吗？我们造了一把它骗不过去的尺子

GAIRPaper104｜Agent真的能自我进化吗？我们造了一把它骗不过去的尺子. 15小时前

重磅！LoopEngineering实操手册公开

重磅！LoopEngineering实操手册公开. 2026-06-22

最新文章

GAIRPaper104｜Agent真的能自我进化吗？我们造了一把它骗不过去的尺子

GAIRPaper104｜Agent真的能自我进化吗？我们造了一把它骗不过去的尺子 15小时前

一次吃下一本书！百度开源新OCR，作者疑似前DeepSeek研究员

一次吃下一本书！百度开源新OCR，作者疑似前DeepSeek研究员 15小时前

LeCun、谢赛宁转发的世界模型与VLA共融方案：中关村学院ECCV2026—VLA-JEPA

LeCun、谢赛宁转发的世界模型与VLA共融方案：中关村学院ECCV2026—VLA-JEPA 15小时前

浙江大学、香港中文大学（深圳）、香港理工大学、北京航空航天大学等知名学者重磅来袭！

浙江大学、香港中文大学（深圳）、香港理工大学、北京航空航天大学等知名学者重磅来袭！ 15小时前

热门类别

综合性期刊物理法学地球科学历史学

相关文章

Catena | 华南植物园王法明研究员团队揭示红树林恢复提升蓝碳质量的微生物调控机制 Plant and Soil | 中南林业科技大学水土保持学院在喀斯特次生演替土壤多功能驱动机制领域取得新进展【团队成果】IF 7.7 Agriculture, Ecosystems and Environment 有机改良剂促进黄土土壤大团聚体中碳酸盐的形成 Catena | 中国科学院环江站李德军团队揭示岩性对西南亚热带森林土壤微生物资源限制的主控效应仇友爱课题组: 有机电化学转化小分子资源

联系我们：info@booksci.cn Book学术提供免费学术资源搜索服务，方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1

京公网安备 11010802042870号

Book学术文献互助

Book学术文献互助群
群号：604180095

Book学术官方微信

小红书