检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:魏力仁[1]
机构地区:[1]湖南师范大学
出 处:《经济数学》1995年第1期55-63,共9页Journal of Quantitative Economics
摘 要:本文研究了在一般状态空间具有平均费用的非平稳Markov决策过程,把在平稳情形用补充的折扣模型的最优方程来建立平均费用的最优方程的结果,推广到非平稳的情形.利用这个结果证明了最优策略的存在性.A nonstationary Markov decision processes with average cost is investigated in the case of the general state space. The results of the optimality equations for average cost established by the optimality equations of a complement discounted model under the case of stationary are extended to the case of nonstationary. By use of this result,the existence of an optimal policy is proved.
关 键 词:MARKOV决策过程 平均费用准则 最优策略
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.30