检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李琳娜[1]
机构地区:[1]长春工程学院电气与信息工程学院,长春130012
出 处:《长春工程学院学报(自然科学版)》2009年第4期81-83,共3页Journal of Changchun Institute of Technology:Natural Sciences Edition
摘 要:对在动态学习的环境中的IGA算法做了研究,改进了梯度方向上的步长恒定不变的不足,引入了变学习率,并介绍了调节学习率的方法——WoLF原则,加速其收敛。最后根据该方法,对Q学习算法做了改进,并通过仿真试验证明了算法的有效性。This paper studied the IGA algorithm in a dynamic learning environment,and improved the insufficiency of step constantly invariable in the gradient direction.The variable learning rate and the WoLF principle to adjust learning rate were introduced in order to accelerate its convergence.Finally the Q learning algorithm was improved based on this method and the validity of the algorithm was proved through the simulation testing.
分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28