无界报酬非时齐折扣马氏决策模型

A NON-STATIONARY DISCOUNTED MARKOVIAN DECISION MODEL WITH UNBOUNDED REWARDS

作　　者：邱德华

出　　处：《衡阳师专学报》1997年第6期16-22,共7页Journal of Hengyang Normal University

摘　　要：讨论了无界报酬非时齐折扣马氏决策模型，且折扣因子βt依赖于前一阶段所处的状态和采取的行动，从而推广了常数折扣因子的马氏决策模型，在一定的假设下，得到了最优方程，证明了存在ε-最优马氏策略。In this paper, a non-stationary discounted Markovian Decision model with unbounded rewards is investigated, in which the discount factor β_t is dependent of the state and the action taken before last step of the system, under some assumptions, the optimality equations are established, and the existence of an ε-optimal policy is proved.

关键词：非时齐折扣马氏决策模型无界报酬最优方程

分类号：O225[理学—运筹学与控制论]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

无界报酬非时齐折扣马氏决策模型

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

无界报酬非时齐折扣马氏决策模型

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索