放弃agent,图灵奖得主Yoshua Bengio提出Scientist AI:避免人类生存威胁

学术头条 2025-02-25 12:06
文章摘要
本文探讨了人工智能(AI)系统可能带来的失控风险,特别是基于强化学习和模仿学习的智能体(agent)可能存在的目标偏差、目标泛化和奖励篡改等问题。为了预防这些风险,图灵奖得主Yoshua Bengio提出了一种非智能体AI系统——Scientist AI。Scientist AI通过理解世界而非直接行动来提供帮助,其设计包括一个世界模型和一个问答推理机器,旨在通过非智能设计降低风险,同时保持高效的科学研究和推理能力。Scientist AI的应用场景包括加速科学发现、作为其他AI系统的安全护栏以及研究如何安全地开发超级智能体。其核心价值在于将复杂系统的解释权交还人类,确保人类始终掌控最终决策权。
放弃agent,图灵奖得主Yoshua Bengio提出Scientist AI:避免人类生存威胁
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。
学术头条
最新文章
热门类别
相关文章
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信