仅需8张4090!影石Insta360开源DA360,低成本刷新全景深度估计SOTA

PaperWeekly 2026-01-11 10:02
文章摘要
背景:全景图像在机器人导航、自动驾驶和AR/VR应用中至关重要,但现有全景深度估计方法主要针对特定室内数据集,在复杂多变的真实室外开放世界中泛化能力严重不足,且存在尺度不一致问题。研究目的:Insta360 Research团队旨在将透视基础模型(如Depth Anything V2)的强大零样本泛化能力高效迁移到全景领域,开发一个能直接输出尺度一致、几何准确深度图的全景深度估计模型。结论:提出的DA360模型通过创新的平移参数学习模块和环形填充技术,结合在视差空间监督的稳定策略,成功解决了零样本泛化不足和尺度不一致两大难题。该模型在标准室内外基准测试中全面超越现有方法,且训练仅需8张RTX 4090显卡,效率极高。团队同时开源了大规模真实城市室外全景深度基准Metropolis,推动了该领域的发展。
仅需8张4090!影石Insta360开源DA360,低成本刷新全景深度估计SOTA
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。
PaperWeekly
最新文章
热门类别
相关文章
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:604180095
Book学术官方微信