再励学习

作品数:50被引量:153H指数:7
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:石纯一张双民张芳颜国正林良明更多>>
相关机构:清华大学北京理工大学上海交通大学吉林大学更多>>
相关期刊:《北京理工大学学报》《信息与控制》《西安交通大学学报》《计算机应用与软件》更多>>
相关基金:国家自然科学基金国家高技术研究发展计划湖北省自然科学基金中国航空科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于改进型蚁群算法的AUV路径规划被引量:9
《自动化与仪表》2017年第3期1-4,共4页董凌艳 徐红丽 
中国科学院国防创新项目(CXJJ-15M031)
在已知障碍物的环境中寻找一条从起点到终点的无碰路径即为路径规划。扩展改进型蚁群算法应用背景,应用于智能水下机器人(AUV)的路径规划。为改善传统蚁群算法在实际应用中的不足,提出加入再励学习机制的改进型蚁群算法。通过对蚁群信...
关键词:路径规划 蚁群算法 再励学习 DIJKSTRA算法 信息素更新 自治水下机器人 
满足匹配律的策略参数搜索决策模型
《中国科学:信息科学》2012年第1期83-98,共16页程振波 张宇 邓志东 
国家自然科学基金(批准号:61005085;60775040;90820305)资助项目
匹配律是决策理论的基本定律之一,它建立了对备选目标的偏好与所获奖励之间的对应关系.通过构建获得匹配律的策略模型,研究了该定律成立的可能机制.基于再励学习理论,提出了通过调整策略参数以满足决策目标的策略搜索模型.在该策略模型...
关键词:策略模型 匹配律 再励学习 决策模型 神经回路 
基于再励学习的交流调速系统模糊神经网络控制被引量:1
《微电机》2011年第1期27-30,共4页杨威 赵金 张华军 
国家自然科学基金资助项目(60874047)
针对矢量控制交流调速系统,该文提出并设计了一种基于再励学习的模糊神经网络速度控制器。详细介绍了基于遗传算法的神经网络权重在线训练方法,仿真对比了输入空间的划分即模糊子集数量对模糊神经网络控制器的训练及其控制效果的影响。...
关键词:模糊神经网络 遗传算法 再励学习 交流调速 
基于Q-Learning适应度函数的演化艺术
《微处理机》2010年第6期45-48,共4页仇颉 
演化艺术通过演化计算演绎出众多妙趣横生的图片,使人们的生活更加多姿多彩。传统演化艺术系统,多采取基于树的表示法,由人工筛选父代基因优良的种群,经由交叉或突变操作,生成子代种群。自动演化艺术系统的出现,使用户从适应度函数的工...
关键词:演化艺术 笛卡尔遗传规划 再励学习 Q学习 
基于遗传算法和神经网络预测的再励学习被引量:5
《计算机工程》2010年第1期18-20,24,共4页张华军 赵金 
国家自然科学基金资助项目(60874047);湖北省自然科学基金资助项目(2007ABA281)
提出一种基于遗传算法和神经网络预测法相结合的再励学习方法,利用遗传算法对全局进行最优解搜索,将进化过程中产生的数据用来训练神经网络预测器,当再励学习逼近最优解时,利用预测网络估计动作网络的参数、结构与系统响应之间的映射关...
关键词:再励学习 遗传算法 神经网络预测 矢量控制 
再励学习及其在移动机器人行为规划中的应用
《工业控制计算机》2009年第8期58-59,共2页林雄 于洪 孙志雄 韩建文 
海南省教育厅自然科学基金资助项目(Hj2009-134)
再励学习(Reinforcement Learning,RL)是一种成功地结合动态编程和控制问题的机器智能方法,它将动态编程和有监督学习方法结合到机器学习系统中,通常用于解决预测和控制两类问题。提出了以矢量形式表示的评估函数,为了实现多维再励学习...
关键词:再励学习 神经网络 智能机器人 行为规划 应用 
优化策略模型下的匹配律算法
《东南大学学报(自然科学版)》2009年第S1期146-151,共6页程振波 邓志东 
国家自然科学基金资助项目(60621062;60775040)
利用基于部分可观马尔可夫决策过程的策略搜索模型,提出了一种具有优化行为的策略搜索算法,并推导出满足匹配律的策略算法.被试可通过调整策略参数,最大化目标值函数的期望值,并根据已往的经验调整策略参数.假定被试所处的环境具有马尔...
关键词:部分可观马尔可夫决策过程 再励学习 优化策略搜索 匹配律 
基于非线性共轭梯度的同时扰动随机逼近方法被引量:2
《华中科技大学学报(自然科学版)》2009年第1期85-87,115,共4页张华军 赵金 王瑞 马坦 
湖北省自然科学基金资助项目(2007ABA281)
为了消除黑塞矩阵和步长因子的影响,利用非线性共轭梯度算法计算搜索方向,在混合非线性共轭梯度算法的作用下保证了每次搜索均为下降方向;利用非精确线搜索方法改进SPSA步长计算方法,通过与下降的搜索方向结合,保证了每次迭代时目标函...
关键词:非线性共轭梯度法 非精确线搜索方法 再励学习 遗传算法 同时扰动随机逼近 
基于再励学习的被动动态步行机器人被引量:6
《清华大学学报(自然科学版)》2008年第1期92-96,共5页毛勇 李实 王家廞 贾培发 杨泽红 丘振 
为了研究仿人、能量高效的双足机器人步行,研制了由MACCEPA(mechanically adjustable compliance and controllable equilibrium position actuator)柔性驱动器驱动的半被动双足机器人,并实现了其动力学仿真系统。提出一种基于再励学习...
关键词:机器人 双足机器人 被动动态步行 再励学习 
基于再励学习蚁群算法的多约束QoS路由方法被引量:10
《计算机科学》2007年第5期25-27,44,共4页陈岩 杨华江 沈林成 
973基础研究项目(No.5130801)
本文研究了多约束QoS路由问题,给出基于模糊评判的路由模型,实现了多QoS约束的综合优化;同时提出一种再励学习蚁群路由算法对该问题进行求解,算法通过对蚂蚁搜索路径进行评价产生再励信号,并根据再励信号采取了不同的信息素更新策略,提...
关键词:多约束QOS 模糊评判 网络路由 再励学习 蚁群算法 
检索报告 对象比较 聚类工具 使用帮助 返回顶部