发布求助

文献互助智能选刊最新文献

AAAI'26 Oral：小样本对齐人类认知，LLM不再模仿答案

数据派THU 2026-02-04 17:00

文章摘要

本文介绍了一项名为GEM的研究，旨在解决大语言模型与人类偏好对齐时面临的数据效率低下问题，特别是在医疗等专业领域。传统方法依赖海量人工标注，而GEM框架从认知科学出发，利用人类偏好背后隐含的多维认知评估过程，通过熵引导的认知过滤模块提取高质量推理链，再经SEGA模块将熵评分转化为隐式奖励，形成闭环优化。实验表明，GEM在仅使用约十分之一数据的情况下，在通用和医学偏好基准上均超越传统方法，并能提升下游任务的推理质量、减少幻觉。该框架为低资源条件下的AI对齐提供了新思路，有潜力广泛应用于各类依赖少量标注的深度学习任务。

AAAI'26 Oral：小样本对齐人类认知，LLM不再模仿答案

本站注明稿件来源为其他媒体的文/图等稿件均为转载稿，本站转载出于非商业性的教育和科研之目的，并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题，请作者速来电或来函联系。

数据派THU

中国通信学会开源技术专委会2025年度全体委员工作会在京召开

中国通信学会开源技术专委会2025年度全体委员工作会在京召开. 12小时前

Nature重磅：图灵预言的AGI早已实现，人类却不敢承认！

Nature重磅：图灵预言的AGI早已实现，人类却不敢承认！. 12小时前

跳出窗口内卷 Sakana AI 给大模型长文本找了新解法

跳出窗口内卷 Sakana AI 给大模型长文本找了新解法. 2026-02-04

大模型如何训练百万 Token 上下文：上下文并行与 Ring Attention

大模型如何训练百万 Token 上下文：上下文并行与 Ring Attention. 2026-02-03

吴家豪：为 AI 赋“能”，为能动赋智 | 提升之路系列（四）

吴家豪：为 AI 赋“能”，为能动赋智 | 提升之路系列（四）. 2026-02-03

最新文章

Nature重磅：图灵预言的AGI早已实现，人类却不敢承认！

Nature重磅：图灵预言的AGI早已实现，人类却不敢承认！ 12小时前

中国通信学会开源技术专委会2025年度全体委员工作会在京召开

中国通信学会开源技术专委会2025年度全体委员工作会在京召开 12小时前

跳出窗口内卷 Sakana AI 给大模型长文本找了新解法

跳出窗口内卷 Sakana AI 给大模型长文本找了新解法 2026-02-04

AAAI'26 Oral：小样本对齐人类认知，LLM不再模仿答案

AAAI'26 Oral：小样本对齐人类认知，LLM不再模仿答案 2026-02-04

热门类别

综合性期刊物理法学地球科学历史学

相关文章

浙江理工大学陈韦教授团队 Adv. Mater.：人工肌肉纤维分子结构设计助力高性能仿生驱动测试伊斯兰银行的发展影响：伊斯兰道德经济方法对发展的应用 Cell Stem Cell |u00A0构建更真实的“体外眼睛”：血管化视网膜类器官助力神经节细胞长期存活与功能重建【翼享学术】酶内电场对酶催化循环的调控机制【前沿进展】Nature背靠背突破 | 谭小军/陈志坚、白晓辰/张学武共同揭示STING的全新调控机制

联系我们：info@booksci.cn Book学术提供免费学术资源搜索服务，方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1

京公网安备 11010802042870号

Book学术文献互助

Book学术文献互助群
群号：604180095

Book学术官方微信