反事实强化学习:如何为预测未来的决策者建模

Decision Making and Imperfection Pub Date : 2012-07-03 DOI:10.1007/978-3-642-36406-8_4

Ritchie Lee, D. Wolpert, J. Bono, S. Backhaus, R. Bent, Brendan D. Tracey

引用次数: 14

摘要

本文章由计算机程序翻译，如有差异，请以英文原文为准。

查看原文本刊更多论文

Counter-Factual Reinforcement Learning: How to Model Decision-Makers That Anticipate the Future

求助全文

通过发布文献求助，成功后即可免费获取论文全文。去求助

来源期刊

自引率

0.00%

发文量

0

Book学术文献互助群
群号：604180095