马尔可夫决策过程中随机即时奖励变量的条件风险值

Am. J. Comput. Math. Pub Date : 2011-09-19 DOI:10.4236/ajcm.2011.13021

Masayuki Kageyama, Takayuki Fujii, K. Kanefuji, H. Tsubaki

{"title":"马尔可夫决策过程中随机即时奖励变量的条件风险值","authors":"Masayuki Kageyama, Takayuki Fujii, K. Kanefuji, H. Tsubaki","doi":"10.4236/ajcm.2011.13021","DOIUrl":null,"url":null,"abstract":"We consider risk minimization problems for Markov decision processes. From a standpoint of making the risk of random reward variable at each time as small as possible, a risk measure is introduced using conditional value-at-risk for random immediate reward variables in Markov decision processes, under whose risk measure criteria the risk-optimal policies are characterized by the optimality equations for the discounted or average case. As an application, the inventory models are considered.","PeriodicalId":359476,"journal":{"name":"Am. J. Comput. Math.","volume":"8 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2011-09-19","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"3","resultStr":"{\"title\":\"Conditional Value-at-Risk for Random Immediate Reward Variables in Markov Decision Processes\",\"authors\":\"Masayuki Kageyama, Takayuki Fujii, K. Kanefuji, H. Tsubaki\",\"doi\":\"10.4236/ajcm.2011.13021\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"We consider risk minimization problems for Markov decision processes. From a standpoint of making the risk of random reward variable at each time as small as possible, a risk measure is introduced using conditional value-at-risk for random immediate reward variables in Markov decision processes, under whose risk measure criteria the risk-optimal policies are characterized by the optimality equations for the discounted or average case. As an application, the inventory models are considered.\",\"PeriodicalId\":359476,\"journal\":{\"name\":\"Am. J. Comput. Math.\",\"volume\":\"8 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2011-09-19\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"3\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Am. J. Comput. Math.\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.4236/ajcm.2011.13021\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Am. J. Comput. Math.","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.4236/ajcm.2011.13021","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 3

摘要

我们考虑马尔可夫决策过程的风险最小化问题。从使每次随机奖励变量的风险尽可能小的角度出发，对马尔可夫决策过程中的随机即时奖励变量引入了一种基于条件风险值的风险度量方法，在这种风险度量标准下，风险最优策略用贴现或平均情况下的最优性方程来表征。作为应用，考虑了库存模型。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

查看原文本刊更多论文

Conditional Value-at-Risk for Random Immediate Reward Variables in Markov Decision Processes

We consider risk minimization problems for Markov decision processes. From a standpoint of making the risk of random reward variable at each time as small as possible, a risk measure is introduced using conditional value-at-risk for random immediate reward variables in Markov decision processes, under whose risk measure criteria the risk-optimal policies are characterized by the optimality equations for the discounted or average case. As an application, the inventory models are considered.

求助全文

通过发布文献求助，成功后即可免费获取论文全文。去求助

来源期刊

Am. J. Comput. Math.

自引率

0.00%

发文量