发布求助

文献互助智能选刊最新文献

大模型上下文卡壳？MIT 用线性回归轻松破局

数据派THU 2026-02-28 17:00

文章摘要

背景：随着大模型处理长上下文任务（如推理、多轮对话）的需求增长，存储历史Token键值对（KV）缓存导致显存占用成为关键瓶颈。传统压缩方法在高压缩率下性能下降快，而现有方案如Cartridges虽有效但端到端梯度优化成本极高。研究目的：MIT团队提出一种名为“Attention Matching”的新方法，旨在通过线性回归等高效线性代数技术，快速压缩KV缓存，以极低成本实现高压缩率并保持模型性能。结论：该方法将复杂的压缩问题分解为键选择、偏置拟合和值拟合三个可高效求解的线性子任务，无需梯度下降，在保持与Cartridges相当压缩精度的同时，将压缩时间缩短了两个数量级，并适用于在线连续压缩等实际场景，为资源受限下的长周期计算提供了可行方案。

大模型上下文卡壳？MIT 用线性回归轻松破局

本站注明稿件来源为其他媒体的文/图等稿件均为转载稿，本站转载出于非商业性的教育和科研之目的，并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题，请作者速来电或来函联系。

数据派THU

首个大规模记忆湖发布，AI Infra跑步进入“记忆”时代

首个大规模记忆湖发布，AI Infra跑步进入“记忆”时代. 17小时前

不用堆算力，华大新出的 Gengram，重新定义基因组建模

不用堆算力，华大新出的 Gengram，重新定义基因组建模. 2026-02-27

原创丨弥补法律判决预测的现实鸿沟：基于证据的法律事实预测（LFP）范式与LFPBench基准数据集（二）

原创丨弥补法律判决预测的现实鸿沟：基于证据的法律事实预测（LFP）范式与LFPBench基准数据集（二）. 2026-02-26

【博士论文】数据驱动决策：通过数据集成与预测性决策支持优化重症监护

【博士论文】数据驱动决策：通过数据集成与预测性决策支持优化重症监护. 2026-02-26

【ICLR2026】缩放推理步数暴露短板：揭示并提升大语言模型中的步数泛化能力

【ICLR2026】缩放推理步数暴露短板：揭示并提升大语言模型中的步数泛化能力. 2026-02-25

最新文章

首个大规模记忆湖发布，AI Infra跑步进入“记忆”时代

首个大规模记忆湖发布，AI Infra跑步进入“记忆”时代 17小时前

大模型上下文卡壳？MIT 用线性回归轻松破局

大模型上下文卡壳？MIT 用线性回归轻松破局 17小时前

不用堆算力，华大新出的 Gengram，重新定义基因组建模

不用堆算力，华大新出的 Gengram，重新定义基因组建模 2026-02-27

【博士论文】数据驱动决策：通过数据集成与预测性决策支持优化重症监护

【博士论文】数据驱动决策：通过数据集成与预测性决策支持优化重症监护 2026-02-26

热门类别

综合性期刊物理法学地球科学历史学

相关文章

iMeta高引论文 | 中科院生态中心邓晔组发布微生物代谢模型网络分析iNAP 2.0 iMeta | 重庆大学王贵学-解析姜黄素类化合物调控抗病毒免疫通路的分子途径文献分享 | Adv. Mater. | 软-硬链集成设计的异质网络SLIPS涂层用于海洋防污工程攻克行业难题！武汉大学最新Science！大连理工大学于泽AEL：“锁碘”策略提升甲脒碘基钙钛矿本征稳定性

联系我们：info@booksci.cn Book学术提供免费学术资源搜索服务，方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1

京公网安备 11010802042870号

Book学术文献互助

Book学术文献互助群
群号：604180095

Book学术官方微信