一般和博弈中的合作多agent学习  被引量:7

Multi-agent learning in cooperative general-sum games

在线阅读下载全文

作  者:宋梅萍[1] 顾国昌[1] 张国印[1] 刘海波[1] 

机构地区:[1]哈尔滨工程大学 计算机科学与技术学院,黑龙江哈尔滨150001

出  处:《控制理论与应用》2007年第2期317-321,共5页Control Theory & Applications

摘  要:理性和收敛是多agent学习研究所追求的目标,在理性合作的多agent系统中提出利用Pareto占优解代替非合作的Nash平衡解进行学习,使agent更具理性,另一方面引入社会公约来启动和约束agent的推理,统一系统中所有agent的决策,从而保证学习的收敛性.利用2人栅格游戏对多种算法进行验证,成功率的比较说明了所提算法具有较好的学习性能.Rationality and convergence are two topics in the research on multi-agent learning. A new method called Pareto-Q is proposed with the concept of Pareto optimum, which is more rational than Nash equilibrium with regard to the cooperative system. At the same time, social conventions are also introduced to promise the convergence of learning. When tested on a two-person grid game, the algorithm performs better than the single Q-learning and Nash-Q learning.

关 键 词:多AGENT学习 一般和随机博弈 NASH平衡 PARETO占优 Q-学习 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象