发布求助

文献互助智能选刊最新文献

用视觉压缩文本！清华、智谱推出Glyph框架：通过视觉-文本压缩扩展上下文窗口

学术头条 2025-10-21 19:00

文章摘要

背景：长上下文建模是大模型发展的关键方向，但扩展到百万token级时面临计算和内存成本激增的挑战。研究目的：清华大学和智谱团队提出Glyph框架，通过将文本渲染为图像进行视觉压缩，以提升上下文窗口的信息密度。方法包括持续预训练建立跨模态对齐、LLM驱动的遗传搜索优化渲染策略、后训练强化细节理解。结论：实验表明Glyph实现3-4倍token压缩，在LongBench等基准上保持与主流模型相当的精度，推理速度提升4倍，且能扩展至百万级文本处理。未来需解决渲染参数敏感性和OCR保真度等问题，并探索自适应渲染等方向。

用视觉压缩文本！清华、智谱推出Glyph框架：通过视觉-文本压缩扩展上下文窗口

本站注明稿件来源为其他媒体的文/图等稿件均为转载稿，本站转载出于非商业性的教育和科研之目的，并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题，请作者速来电或来函联系。

学术头条

年终拆解：爆火的AI Coding Agent是什么？有哪些“坑”？

年终拆解：爆火的AI Coding Agent是什么？有哪些“坑”？. 2025-12-29

Meta公布“超级智能”新进展：无需人类，软件Agent即可自我训练！

Meta公布“超级智能”新进展：无需人类，软件Agent即可自我训练！. 2025-12-26

人人编程时代到来！智谱发布GLM-4.7：Vide Coding能力全球开源第一

人人编程时代到来！智谱发布GLM-4.7：Vide Coding能力全球开源第一. 2025-12-23

全球首次实现！上海交大推出全光生成式AI芯片LightGen，研究登上Science

全球首次实现！上海交大推出全光生成式AI芯片LightGen，研究登上Science. 2025-12-22

Karpathy年终大模型清单：Vibe Coding、Claude Code、Nano Banana等上榜

Karpathy年终大模型清单：Vibe Coding、Claude Code、Nano Banana等上榜. 2025-12-21

最新文章

ICLR 2026 | 告别单一记忆粒度！MemGAS 让智能体不再“转头就忘”

ICLR 2026 | 告别单一记忆粒度！MemGAS 让智能体不再“转头就忘” 2026-03-11

含「AI」量超 70%！蚂蚁集团 2026 春招全面启动

含「AI」量超 70%！蚂蚁集团 2026 春招全面启动 2026-03-11

首个Token为何沦为数值垃圾桶？LeCun团队解构大模型底层机制

首个Token为何沦为数值垃圾桶？LeCun团队解构大模型底层机制 2026-03-09

人大 × 字节团队破解muP理论分歧：用谱条件统一宽深Scaling

人大 × 字节团队破解muP理论分歧：用谱条件统一宽深Scaling 2026-03-09

热门类别

综合性期刊物理法学地球科学历史学

相关文章

研究透视：米特公司，光子芯片-滑雪跳台 | Nature 研究透视：大规模相干4D成像芯片，Pointcloud公司 | Nature 研究进展：SEEQC公司，超导量子芯片-全数字化量子计算 | Nature Electronics 广东工业大学王晶AFM：通过自烷基链工程减少高效稳定反式钙钛矿太阳能电池的开压损失南开大学谢微课题组：表面等离激元介导化学反应的研究进展

联系我们：info@booksci.cn Book学术提供免费学术资源搜索服务，方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1

京公网安备 11010802042870号

Book学术文献互助

Book学术文献互助群
群号：604180095

Book学术官方微信