检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《上海交通大学学报》2009年第11期1751-1755,共5页Journal of Shanghai Jiaotong University
基 金:国家自然科学基金资助项目(50705054);国家高技术研究发展计划(863)项目(2006AA040203)
摘 要:为了解救陷入环境障碍的自主移动机器人,提出了一种基于强化学习的自救脱困控制方法.该方法通过移动机器人与环境的交互作用,能够在线学习实现脱困自救的运动控制策略,并利用机器人自身条件克服环境障碍,避免了实施救援机器人的行动和终止其作业任务所造成的损失.利用工作环境的先验知识指导,设计含有启发信息的强化学习系统回报函数,保证搜索和学习控制策略向正确方向进行,同时提高学习控制器的适应性和鲁棒性.数字仿真证明了通过自学习控制策略实现自救脱困的可行性.A control technique to achieve self-rescue of autonomous mobile robot from obstacle environment based on reinforcement learning was proposed. Motion control strategy of self-rescue was got on line through the interaction between the mobile robot and the obstacle environment, so the self-rescue control technique helps to overcome obstacle environment by the autonomous mobile robot independently and avoid the loss from rescue activity and task failure. Prior knowledge of working environment was applied to direct the design of heuristic reward function for the reinforcement learning system, which guarantees the correct direction of searching and learning control strategy. The simulation experiments indicate that it is feasible to achieve self-rescue by self learning control strategy.
关 键 词:自主移动机器人 反应式控制 Q学习 启发式回报函数
分 类 号:TP242[自动化与计算机技术—检测技术与自动化装置]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.119.122.86