检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:胡奇英[1]
机构地区:[1]西安电子科技大学七系,710071
出 处:《数理统计与应用概率》1995年第2期31-37,共7页
基 金:国家自然科学基金
摘 要:本文讨论报酬为[1]中无界型的折扣马氏决策规划中的逐次逼近法,包括通常的逐次逼近法和有限状态逼近可数状态问题中的逐次逼近法,讨论了两者的收敛性和后者界的估计。This paper investigated the successive approximating methods, including the usual case and the case in the problems of finite state approximation for denumerable state, in discounted Markov decision programming with unbounded rewards presented in [1]. The convergence of the both method and the bounds of the later are obtained.
分 类 号:O211.62[理学—概率论与数理统计] O221[理学—数学]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.118.30.3