检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王建国[1] 梁松阳[1] 张洋[1] 孟祥甫[1]
机构地区:[1]东北电力大学自动化工程学院,吉林吉林132012
出 处:《计算机应用与软件》2009年第7期37-38,42,共3页Computer Applications and Software
基 金:国家重点基础研究发展计划项目(2007CB206900)
摘 要:针对在Robocup中型四人组机器人足球比赛中,原有的投票机制在进行角色分配时产生的系统震荡问题和系统反应不灵敏问题,提出用动态权值的投票机制进行解决。由于投票函数的设定有很大的人为因素,而强化学习在与环境的交互时的试错可能给系统带来风险损失,因此把动态权值的投票机制与Q学习相结合应用于角色分配。通过仿真验证了方法的有效性。Aiming at the system vibration problem and the lower sensitive of system problem in previous voting mechanism when assigning roles in robots league soccer competition of Roboeup of middle size of four,this paper puts forward the dynamic power voting mechanism to resolve them. Considering of the considerable human factors in voting function setting and the possible risking loss which the system may suffer from trial error during the process of interactive between the agent in reinforcement learning and the environment, in the paper it combines dynamic power voting mechanism with Q-learning and applies it in the role assignment. FinaUy,the simulation experiment is made to verify the effectiveness of the method.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28