检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]上海交通大学自动化系,上海200030 [2]中国科学院机器人学开放研究实验室,沈阳110015
出 处:《机器人》2001年第4期379-384,共6页Robot
基 金:国家自然科学基金重点项目 ( 698895 0 1 ); 863计划项目 ( 863- 5 1 2 - 935 5 - 0 2 )
摘 要:虽然基于行为控制的自主机器人具有较高的鲁棒性 ,但其对于动态环境缺乏必要的自适应能力 .强化学习方法使机器人可以通过学习来完成任务 ,而无需设计者完全预先规定机器人的所有动作 ,它是将动态规划和监督学习结合的基础上发展起来的一种新颖的学习方法 ,它通过机器人与环境的试错交互 ,利用来自成功和失败经验的奖励和惩罚信号不断改进机器人的性能 ,从而达到目标 ,并容许滞后评价 .由于其解决复杂问题的突出能力 ,强化学习已成为一种非常有前途的机器人学习方法 .本文系统论述了强化学习方法在自主机器人中的研究现状 ,指出了存在的问题 ,分析了几种问题解决途径 ,展望了未来发展趋势 .Even though autonomous mobile robots based on behaviour approaches are robust for many tasks and environments, they are not necessarily adaptive for dynamic environments. Reinforcement learning (RL) offers a powerful set of techniques that allow a robot to learn a task without requiring its designer to fully specify how it should be carried out. RL is a novel approach to machine intelligence that combines dynamic programming and supervised learning. RL is widely noticed as a promising method for robot learning because of its following advantages: (1) Behaviors of robot can be acquired only by assigning rewards and punishments; (2) Rewards and punishments can have a delay. Firstly, we analyzed the basic problems in robotic learning, and then introduced the principle and basic algorithms of RL, thirdly discussed several important problems and some solving approaches, in the end, pointed out the future development direction.
分 类 号:TP242[自动化与计算机技术—检测技术与自动化装置]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.221.29.46