Conditional Value-at-Risk for Random Immediate Reward Variables in Markov Decision Processes

Am. J. Comput. Math. Pub Date : 2011-09-19 DOI:10.4236/ajcm.2011.13021

Masayuki Kageyama, Takayuki Fujii, K. Kanefuji, H. Tsubaki

引用次数: 3

Abstract

We consider risk minimization problems for Markov decision processes. From a standpoint of making the risk of random reward variable at each time as small as possible, a risk measure is introduced using conditional value-at-risk for random immediate reward variables in Markov decision processes, under whose risk measure criteria the risk-optimal policies are characterized by the optimality equations for the discounted or average case. As an application, the inventory models are considered.

查看原文本刊更多论文

马尔可夫决策过程中随机即时奖励变量的条件风险值

我们考虑马尔可夫决策过程的风险最小化问题。从使每次随机奖励变量的风险尽可能小的角度出发，对马尔可夫决策过程中的随机即时奖励变量引入了一种基于条件风险值的风险度量方法，在这种风险度量标准下，风险最优策略用贴现或平均情况下的最优性方程来表征。作为应用，考虑了库存模型。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊

Am. J. Comput. Math.

自引率

0.00%

发文量