检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]南京大学软件学院,南京210093
出 处:《计算机应用研究》2010年第2期401-404,共4页Application Research of Computers
基 金:国家自然科学基金资助项目(60775046)
摘 要:预测状态表示是描述离散时间有限状态的动态系统的新方法。使用动作—观测值序列的预测向量表示系统状态在将来时刻发生的概率,能解决现有动态系统决策过程中计算复杂的问题。综述了预测状态表示的基本原理,介绍了预测状态表示的建模过程和规划算法,对已有的建模方法和规划方法进行总结分析和比较,指出了该研究领域的发展方向,最后提出了研究面临的挑战。Predictive state representations ( PSRs ) are new models for discrete-time finite action and observation stochastic systems. Because a PSR represents the system' s state as a set of predictions of the observable outcomes of tests performed in the system, it can solve the computing problems in exist stochastic decision systems. This paper introduced the principles of PSR models, surveyed the PSR model and planning techniques, analyzed and compared the fundamental principles behind the modeling and planning algorithms of PSR, pointed out the development trend, and gave the challenges that the research of PSR was facing.
关 键 词:动态系统 预测状态表示 发现核心测试 学习模型参数 规划算法
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222