检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]北京工业大学人工智能与机器人研究所,北京100124
出 处:《清华大学学报(自然科学版)》2008年第S2期1747-1750,共4页Journal of Tsinghua University(Science and Technology)
基 金:国家自然科学基金资助项目(60375017);北京市优秀人才培养资助项目(2006D0501500203);北京市教委科技发展计划项目(KM2006100050190)
摘 要:为了提高移动机器人的自学习能力,在基于行为控制结构的基础上设计了智能控制结构,该结构引入了强化学习模块。神经网络具有很好的泛化能力,该文提出了基于神经网络的强化Q学习算法,克服了表格式Q学习算法只能应用到离散的状态中并需要大量存储空间的不足,最后结合智能控制结构应用到移动机器人的避障中。实验结果表明,该方法能够使移动机器人通过自学习实现自主避障。An intelligent control architecture with reinforcement learning was designed based on a behavior-based architecture to improve the learning ability of mobile robots.Normal tabular Q-learning can only be applied to discrete states and requires a large memory.Since neural networks have good generalization,a Q-learning system was developed based on a neural network for obstacle avoidance of mobile robots.Experiments show that the mobile robot can then learn to avoid obstacles.
分 类 号:TP242[自动化与计算机技术—检测技术与自动化装置]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.9