Nature一周论文导读|2025年8月28日
环球科学科研圈
2025-09-08 12:02
文章摘要
背景:传统规范化建模框架(如贝叶斯推理和强化学习)在捕捉实际生物行为方面存在局限性。研究目的:提出利用循环神经网络探索决策行为的新方法,并在奖赏学习任务中验证其性能。结论:该方法比经典认知模型表现更优,能有效预测个体选择行为,并可通过动态系统概念解释网络机制,为开发元强化学习人工智能体提供计算法则。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。