发布求助

文献互助智能选刊最新文献

北大团队提出SHINE：将任意文本转化为大模型LoRA，仅需一次前向传播！

机器学习算法与自然语言处理 2026-03-24 08:17

文章摘要

背景：本文介绍了北京大学团队提出的SHINE超网络架构，该架构能够将任意文本通过一次前向传播转化为大语言模型的LoRA参数，从而将文本知识内化到模型参数中，支持基于文本的多轮对话。研究目的：旨在解决大模型快速适配、持续学习、参数化记忆等热点问题，通过创新的超网络设计，提升生成LoRA参数的效率和表达能力，克服现有方法在架构扩展性和任务复杂性上的限制。结论：实验表明，SHINE在文本重建、问答等任务上表现优异，接近或超过In-Context方法，同时大幅减少计算开销和时间消耗，展现了良好的规模化潜力和应用前景，为持续学习提供了新思路。

北大团队提出SHINE：将任意文本转化为大模型LoRA，仅需一次前向传播！

本站注明稿件来源为其他媒体的文/图等稿件均为转载稿，本站转载出于非商业性的教育和科研之目的，并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题，请作者速来电或来函联系。

机器学习算法与自然语言处理

刚刚，OpenClaw最猛升级！底层架构大换血，全网等了9天

刚刚，OpenClaw最猛升级！底层架构大换血，全网等了9天. 15小时前

必看！SebastianRaschka新博客盘点了所有主要注意力机制

必看！SebastianRaschka新博客盘点了所有主要注意力机制. 15小时前

浙大&腾讯打破图像编辑「规模-质量」魔咒：1000万数据+统一验证框架，让开源模型追上闭源SOTA|CVPR2026

浙大&腾讯打破图像编辑「规模-质量」魔咒：1000万数据+统一验证框架，让开源模型追上闭源SOTA|CVPR2026. 15小时前

北邮00后UP主，早在2023年初就开发出了「龙虾」！

北邮00后UP主，早在2023年初就开发出了「龙虾」！. 2026-03-22

CVPR 2026 | 给扩散模型装上「物理引擎」:北大彭宇新团队提出NS-Diff，使扩散模型学会流体与刚体力学

CVPR 2026 | 给扩散模型装上「物理引擎」:北大彭宇新团队提出NS-Diff，使扩散模型学会流体与刚体力学. 2026-03-22

最新文章

浙大&腾讯打破图像编辑「规模-质量」魔咒：1000万数据+统一验证框架，让开源模型追上闭源SOTA|CVPR2026

浙大&腾讯打破图像编辑「规模-质量」魔咒：1000万数据+统一验证框架，让开源模型追上闭源SOTA|CVPR2026 15小时前

北大团队提出SHINE：将任意文本转化为大模型LoRA，仅需一次前向传播！

北大团队提出SHINE：将任意文本转化为大模型LoRA，仅需一次前向传播！ 15小时前

必看！SebastianRaschka新博客盘点了所有主要注意力机制

必看！SebastianRaschka新博客盘点了所有主要注意力机制 15小时前

刚刚，OpenClaw最猛升级！底层架构大换血，全网等了9天

刚刚，OpenClaw最猛升级！底层架构大换血，全网等了9天 15小时前

热门类别

综合性期刊物理法学地球科学历史学

相关文章

Sci Adv | 破解胶质瘤的“隐身术”！华中科技大学姜晓兵等团队合作揭示USP14如何帮助肿瘤逃避免疫监视，为联合治疗提供新策略 Cancer Res | 老药新用新进展！李传元等团队发现靶向DGAT1诱导铁死亡，大幅增强肿瘤免疫治疗效果 IF=53！广州医科大学卓扬佳/钟惟德/何慧婵开发化疗-光热协同疗法，诱导铁死亡，促进抗肿瘤免疫并预防复发 Science子刊 | 天津医科大学刘强团队通过靶向骨髓微环境，阻断异常粒细胞生成或可根治视神经脊髓炎谱系疾病 Science | 抢在癌症形成之前，KRAS抑制剂在胰腺癌临床前模型中实现"癌症拦截"

联系我们：info@booksci.cn Book学术提供免费学术资源搜索服务，方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1

京公网安备 11010802042870号

Book学术文献互助

Book学术文献互助群
群号：604180095

Book学术官方微信