多AGENT学习

作品数:13被引量:33H指数:4
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:王长缨黄庆成周浦城洪炳镕宋梅萍更多>>
相关机构:国防科学技术大学哈尔滨工业大学哈尔滨工程大学南京大学更多>>
相关期刊:《模式识别与人工智能》《长春工程学院学报(自然科学版)》《计算机工程与应用》《电子学报》更多>>
相关基金:国家自然科学基金上海市科学技术委员会资助项目上海市教育委员会创新基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
跨层认知无线Mesh网络中多agent学习的功率分配策略被引量:2
《计算机应用研究》2015年第10期3101-3103,3113,共4页李跃新 杨岗 
湖北省国际交流与合作项目(2012IHA0140)
为了改善无线Mesh网络的无线电频谱的利用效率以及提高能源利用效率,提出跨层认知无线Mesh网络中多agent学习的功率分配策略。首先,通过多agent智能学习方法,将网络状态定位为一个有限状态马尔可夫决策过程,在环境状态变化时,通过任务...
关键词:认知无线Mesh网络 多agent智能学习 奖励机制 非合作博弈模式 功率分配策略 
多Agent MDPs中并行Rollout学习算法
《安徽工程大学学报》2014年第2期75-78,共4页李豹 
文章在rollout算法基础上研究了在多Agent MDPs的学习问题.利用神经元动态规划逼近方法来降低其空间复杂度,从而减少算法"维数灾".由于Rollout算法具有很强的内在并行性,文中还分析了并行求解方法.通过多级仓库库存控制的仿真试验,验证...
关键词:ROLLOUT算法 神经元动态规划 多AGENT学习 性能势 并行算法 
基于多Agent学习机制的服务组合
《计算机工程与科学》2013年第9期117-121,共5页赵海燕 曹健 徐文博 
国家自然科学基金资助项目(61073021;61272438;60970012);上海市科委项目(12511502704;11511500102;10DZ1200200);上海交通大学医工交叉项目(YG2011MS38);上海市教委科研创新项目(13ZZ112)
服务Agent能够利用本身的功能以及来自外部的多个软件服务,向外界提供更为高层的服务。为了向用户提供综合的功能,服务Agent之间必须通过相互协同实现服务组合。提出了一种依靠多Agent学习机制进行服务组合的方法,其独特性在于通过学习...
关键词:服务组合 服务AGENT 多AGENT学习 
基于联合博弈的多Agent学习
《计算机与数字工程》2011年第6期21-24,共4页黄付亮 张荣国 陈大川 刘焜 
国家自然科学基金项目(编号:50775060)资助
在研究Q-Learning算法的基础上,将博弈论中的团队协作理论引入到强化学习中,提出了一种基于联合博弈的多Agent学习算法。该算法通过建立多个阶段博弈,根据回报矩阵对阶段博弈的结果进行评估,为其提供一种有效的A-gent行为决策策略,使每...
关键词:AGENT 强化学习 联合博弈 MAS 
一个基于XCS的同质团队学习模型被引量:1
《计算机工程与科学》2010年第5期37-40,44,共5页陶那日苏 王崇骏 张雷 谢俊元 
国家自然科学基金资助项目(60875038;60721002;60503021);江苏省支撑计划项目(BE2009142)
同质团队学习是实现多Agent协作的一种方法。但是,传统方法仅在系统运行的前后对目标Agent进行修改,系统运行过程没有直接对Agent的改进做出贡献。本文利用合作策略,在学习分类器系统XCS的基础上提出了一种同质团队学习模型,弥补了传统...
关键词:多AGENT学习 学习分类器系统 合作策略 
基于变学习率的多agent学习算法的研究
《长春工程学院学报(自然科学版)》2009年第4期81-83,共3页李琳娜 
对在动态学习的环境中的IGA算法做了研究,改进了梯度方向上的步长恒定不变的不足,引入了变学习率,并介绍了调节学习率的方法——WoLF原则,加速其收敛。最后根据该方法,对Q学习算法做了改进,并通过仿真试验证明了算法的有效性。
关键词:多AGENT学习 变学习率 Q学习 
群体环境下基于随机对策的多Agent局部学习算法
《信息与控制》2008年第6期703-708,共6页尹怡欣 江道平 班晓娟 孟祥嵩 
国家自然科学基金资助项目(60503024;60374032)
基于群体环境中个体agent局部感知和交互的生物原型,提出一种随机对策框架下的多agent局部学习算法.算法在与局部环境交互中采用贪婪策略最大化自身利益.分别在零和、一般和的单个平衡点和多个平衡点情形下改进了Nash-Q学习算法;提出了...
关键词:多AGENT学习 随机对策 Nash—Q 局部学习 
一种基于多agent学习的电子市场智能定价方法
《计算机工程与应用》2007年第15期208-211,共4页韩伟 王云 吕捷 
江苏省教育厅"青蓝工程"优秀青年骨干教师计划。
B2B电子市场的定价问题是一个半学习半推理的连续决策过程,每个定价agent不是直接采用多agent学习算法下的均衡策略,而是根据博弈历史进行推理决策,并不断学习对手的策略。提出了基于内省推理方法的多agent环境下agent高效在线学习方法...
关键词:多AGENT系统 在线学习 内省推理 电子市场 
一般和博弈中的合作多agent学习被引量:7
《控制理论与应用》2007年第2期317-321,共5页宋梅萍 顾国昌 张国印 刘海波 
理性和收敛是多agent学习研究所追求的目标,在理性合作的多agent系统中提出利用Pareto占优解代替非合作的Nash平衡解进行学习,使agent更具理性,另一方面引入社会公约来启动和约束agent的推理,统一系统中所有agent的决策,从而保证学习的...
关键词:多AGENT学习 一般和随机博弈 NASH平衡 PARETO占优 Q-学习 
多Agent协作的强化学习模型和算法被引量:6
《计算机科学》2006年第12期156-158,186,共4页刘菲 曾广周 宋言伟 
国家自然科学基金项目资助(编号:60573169)。
结合强化学习技术讨论了多Agent协作学习的过程,构造了一个新的多Agent协作学习模型。在这个模型的基础上,提出一个多Agent协作学习算法。算法充分考虑了多Agent共同学习的特点,使得Agent基于对动作长期利益的估计来预测其动作策略,并...
关键词:协作学习 强化学习 多AGENT学习 学习模型 学习算法 
检索报告 对象比较 聚类工具 使用帮助 返回顶部