宋言伟

作品数:1被引量:6H指数:1
导出分析报告
供职机构:山东大学更多>>
发文主题:工作流自动机学习算法多AGENT学习多AGENT协作更多>>
发文领域:自动化与计算机技术金属学及工艺更多>>
发文期刊:《计算机科学》更多>>
所获基金:国家自然科学基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-1
视图:
排序:
多Agent协作的强化学习模型和算法被引量:6
《计算机科学》2006年第12期156-158,186,共4页刘菲 曾广周 宋言伟 
国家自然科学基金项目资助(编号:60573169)。
结合强化学习技术讨论了多Agent协作学习的过程,构造了一个新的多Agent协作学习模型。在这个模型的基础上,提出一个多Agent协作学习算法。算法充分考虑了多Agent共同学习的特点,使得Agent基于对动作长期利益的估计来预测其动作策略,并...
关键词:协作学习 强化学习 多AGENT学习 学习模型 学习算法 
检索报告 对象比较 聚类工具 使用帮助 返回顶部