王圣镔

作品数:3被引量:12H指数:2
导出分析报告
供职机构:东北电力大学信息工程学院更多>>
发文主题:蚁群算法Q学习多AGENT轮盘Q值更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《计算机工程与设计》《计算机工程与应用》更多>>
所获基金:吉林省科技发展计划基金教育部科学技术研究重点项目更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-3
视图:
排序:
基于量子理论及蚁群算法的多Agent Q学习被引量:2
《计算机工程与应用》2010年第21期43-46,共4页孟祥萍 王圣镔 
吉林省科技发展计划项目No.20070530;吉林省教育厅重点科技计划项目及教科合字[2008]第201号~~
针对多Agent协作强化学习中存在的行为和状态维数灾问题,以及行为选择上存在多个均衡解,为了收敛到最佳均衡解需要搜索策略空间和协调策略选择问题,提出了一种新颖的基于量子理论和蚁群算法的多Agent协作学习算法。新算法首先借签了量...
关键词:多AGENT系统 协作 量子计算 Q-学习 均衡解 蚁群算法 
多Agent Q学习几点问题的研究及改进被引量:5
《计算机工程与设计》2009年第9期2274-2276,共3页孟祥萍 王圣镔 王欣欣 
教育部科学技术研究基金项目(206035);吉林省科技发展计划基金项目(20070530)
提出了一种新颖的基于Q-学习,蚁群算法和轮盘赌算法的多Agent强化学习。在强化学习算法中,当Agent数量增加到足够大时,就会出现动作空间灾难性问题,即:其交互困难,学习速度骤然下降。另外,由于Agent是利用Q值来选择下一步动作的,因此,...
关键词:多Agent强化学习算法 蚁群算法 轮盘赌算法 Q值 动作空间灾难 
基于蚁群算法和轮盘算法的多Agent Q学习被引量:5
《计算机工程与应用》2009年第16期60-62,共3页孟祥萍 王圣镔 王欣欣 
吉林省科技发展计划项目(No.20070530)~~
提出了一种新颖的基于Q-学习、蚁群算法和轮盘赌算法的多Agent强化学习。在强化学习算法中,当Agent数量增加到足够大时,就会出现动作空间灾难性问题,即:其学习速度骤然下降。另外,Agent是利用Q值来选择下一步动作的,因此,在学习早期,动...
关键词:多Agent强化学习算法 蚁群算法 轮盘赌算法 
检索报告 对象比较 聚类工具 使用帮助 返回顶部