检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]深圳职业技术学院计算机应用工程系,广东深圳518055 [2]中南大学信息科学与工程学院,湖南长沙410083
出 处:《计算机工程与设计》2007年第9期2116-2119,2126,共5页Computer Engineering and Design
基 金:国家863高技术研究发展计划基金项目(2001AA4422200)
摘 要:部分可观察马尔可夫决策过程是通过引入信念状态空间将非马尔可夫链问题转化为马尔可夫链问题来求解,其描述真实世界的特性使它成为研究随机决策过程的重要分支。介绍了部分可观察马尔可夫决策过程的基本原理和决策过程,然后介绍了3种典型的算法,它们分别是Littman等人的Witness算法、Incremental Pruning算法和Pineau等人的基于点的值迭代算法,对这3种算法进行了分析比较。讲述部分可观察马尔可夫决策过程的应用。Partially observable Markov decision processes (POMDP) changes the non Markovian into Markovian over the belief state space. It has been an important branch of stochastic decision processes for its characteristics of describing the real world. At first, the principles and decision processes of POMDP is described, then three typical algorithms is presented, including Littman, et al's witness algorithm, incremental pruning algorithm and Pineau, et ars point-based value iteration algorithm, and the results from each of algorithms are analyzed and compared. At last, some applications are introduced using POMDP.
关 键 词:部分可观察马尔可夫 决策算法 智能体 马尔可夫链 值迭代算法
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.225.7.106