检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]北京林业大学信息学院,北京100083 [2]中国航天科工集团706所,北京100854
出 处:《计算机工程与应用》2009年第34期25-28,52,共5页Computer Engineering and Applications
基 金:国家"十一五"科技支撑计划重大项目资助No.2006BAD03A02~~
摘 要:强化学习是一种重要的机器学习方法,然而在实际应用中,收敛速度缓慢是其主要不足之一。为了提高强化学习的效率,提出了一种并行强化学习算法。多个同时学习,在各自学习一定周期后,利用D-S证据利用对学习结果进行融合,然后在融合结果的基础上,各进行下一周期的学习,从而实现提高整个系统学习效率的目的。实验结果表明了该方法的可行性和有效性。Reinforcement learning is an important machine learning method.However,slow convergence has been one of main problem in practice.To improve the efficiency of reinforcement learning,this paper proposes parallel reinforcement learning algorithm.There are multiple agents in learning system.In a learning episode ,each agent learns independently.After a learning episode, the results of all agents are fused based on D-S evidence theory so as to achieve common result, which are shared by all agents in next learning episode.Experiments show the feasibility and efficiency of the algorithm.
关 键 词:并行算法 强化学习 Q-学习 D—S证据理论 路径规划
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.120