无界报酬折扣马氏决策规划中的逐次逼近法  

Discounted Markov Decision Programming with Unbounded Rewards: Successive Approximating Methods

在线阅读下载全文

作  者:胡奇英[1] 

机构地区:[1]西安电子科技大学七系,710071

出  处:《数理统计与应用概率》1995年第2期31-37,共7页

基  金:国家自然科学基金

摘  要:本文讨论报酬为[1]中无界型的折扣马氏决策规划中的逐次逼近法,包括通常的逐次逼近法和有限状态逼近可数状态问题中的逐次逼近法,讨论了两者的收敛性和后者界的估计。This paper investigated the successive approximating methods, including the usual case and the case in the problems of finite state approximation for denumerable state, in discounted Markov decision programming with unbounded rewards presented in [1]. The convergence of the both method and the bounds of the later are obtained.

关 键 词:马氏决策规划 逐次逼近法 无界报酬 折扣 报酬 

分 类 号:O211.62[理学—概率论与数理统计] O221[理学—数学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象