检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:朴松昊[1] 孙立宁[1] 钟秋波[1] 黄庆成[1]
机构地区:[1]哈尔滨工业大学机电工程学院,黑龙江哈尔滨150001
出 处:《华中科技大学学报(自然科学版)》2008年第S1期39-41,52,共4页Journal of Huazhong University of Science and Technology(Natural Science Edition)
基 金:国家高科技发展计划重点基金资助项目(2007AA041603)
摘 要:提出了在动态环境中,多Agent的一种协作模型,适用于环境信息不完备的复杂情况.将Agent的独立强化学习与BDI模型结合起来,使多Agent系统不但拥有强化学习的高度反应性和自适应性,而且拥有BDI的推理能力,使只使用数值分析而忽略推理环节的强化学习结合了逻辑推理方法.使用了Borlzman选取随机动作,并且采用了新的奖励函数和表示方法,减少了学习空间,提高了学习速度.仿真结果表明所提方法可行,能够满足多Agent系统的要求.In this paper,a new multi-agent cooperating model of dynamic enviroment is proposed,which is suitable for complex situation of incomplete enviroment information.By combination of independence reinforcement study and the belief-desire-intention(BDI) model,multi-agent system has not only highly reactivity but also reasoning faculty.The method reduces study space by a new reinforcement function and increases study speed by Borlzman function.The results of simulation experiment indicate the effectiveness of the...
分 类 号:TP242[自动化与计算机技术—检测技术与自动化装置]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7