云南高校图书馆联盟文献共享服务平台- Q-学习算法

Q-学习算法: 作品数：27被引量：135H指数：7; 导出分析报告; 相关领域：自动化与计算机技术更多>>; 相关作者：胡子婴张峰徐如燕张宇轩刘凯更多>>; 相关机构：哈尔滨理工大学哈尔滨工业大学河北大学吉林大学更多>>; 相关期刊：《西南交通大学学报》《上海交通大学学报》《电子技术应用》《北京理工大学学报》更多>>; 相关基金：国家自然科学基金国家高技术研究发展计划河北省教育厅青年基金中国博士后科学基金更多>>

-

在结果中检索

检索结果分析

结果分析中...

选择条件：

期刊=上海交通大学学报

共条记录，以下是1-1

全选清除导出

参考文献引证文献引用追踪

视图：

排序：

基于Markov对策和强化学习的多智能体协作研究被引量：7: 《上海交通大学学报》2001年第2期288-292,共5页李晓萌杨煜普许晓鸣; 国家自然科学基金!资助项目 (3930 0 70 ); MAS的协作机制研究 ,当前比较适用的研究框架是非零和 Markov对策及基于 Q-算法的强化学习 .但实际上在这种框架下的 Agent强调独立学习而不考虑其他 Agent的行为 ,故 MAS缺乏协作机制 .并且 ,Q-算法要求 Agent与环境的交互时具有完备...; 关键词：MARKOV对策 Q-学习算法协调学习多智能体系统强化学习

全选清除导出

共1页<1>

检索报告对象比较聚类工具使用帮助返回顶部