发布求助

文献互助智能选刊最新文献

Policy Learning for Time-Bounded Reachability in Continuous-Time Markov Decision Processes via Doubly-Stochastic Gradient Ascent

International Conference on Quantitative Evaluation of Systems Pub Date : 2016-05-31 DOI:10.1007/978-3-319-43425-4_17

E. Bartocci, L. Bortolussi, T. Brázdil, D. Milios, G. Sanguinetti

引用次数: 8

查看原文本刊更多论文

基于双随机梯度上升的连续时间马尔可夫决策过程有界可达性策略学习

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊

International Conference on Quantitative Evaluation of Systems

International Conference on Quantitative Evaluation of Systems

自引率

0.00%

发文量

0

联系我们：info@booksci.cn Book学术提供免费学术资源搜索服务，方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1

京公网安备 11010802042870号

Book学术文献互助

Book学术文献互助群
群号：604180095

Book学术官方微信