MARKOV对策

作品数:13被引量:86H指数:5
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:许晓鸣李晓萌杨煜普张化祥高阳更多>>
相关机构:上海交通大学南京大学西北工业大学南京航空航天大学更多>>
相关期刊:《计算机技术与发展》《中国机械工程》《计算机工程与应用》《信息与控制》更多>>
相关基金:国家自然科学基金中央级公益性科研院所基本科研业务费专项国家教育部博士点基金国家高技术研究发展计划更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=软件学报x
条 记 录,以下是1-1
视图:
排序:
基于后悔值的多Agent冲突博弈强化学习模型被引量:6
《软件学报》2008年第11期2957-2967,共11页肖正 张世永 
对于冲突博弈,研究了一种理性保守的行为选择方法,即最小化最坏情况下Agent的后悔值.在该方法下,Agent当前的行为策略在未来可能造成的损失最小,并且在没有任何其他Agent信息的条件下,能够得到Nash均衡混合策略.基于后悔值提出了多Agen...
关键词:MARKOV对策 强化学习 冲突博弈 冲突消解 
检索报告 对象比较 聚类工具 使用帮助 返回顶部