检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]琼州大学信息科学与技术学院,海南三亚572022
出 处:《工业控制计算机》2009年第8期58-59,共2页Industrial Control Computer
基 金:海南省教育厅自然科学基金资助项目(Hj2009-134)
摘 要:再励学习(Reinforcement Learning,RL)是一种成功地结合动态编程和控制问题的机器智能方法,它将动态编程和有监督学习方法结合到机器学习系统中,通常用于解决预测和控制两类问题。提出了以矢量形式表示的评估函数,为了实现多维再励学习,用一专门的神经网络(Q网络)实现评判网络,研究其在移动机器人行为规划中的应用。Reinforcement Learning(RL) is an approach to machine intelligence that combines two problems of Dynamic Programming and Control successfully.It combines the fields of dynamic programming and supervised learning to yield powerful machine-learning systems.RL has traditionally been used to solve problems of prediction and control.This paper proposes an evaluation function expressed in a vector form in order to realize multi-dimensional reinforcement learning.Q-learning,A special neural network (Q-net) is proposed to realize critic networks.at the end,we investigate the application of a Reinforcement learning in behavior planning.
分 类 号:TP242[自动化与计算机技术—检测技术与自动化装置] U491.51[自动化与计算机技术—控制科学与工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15