王欣欣

作品数:2被引量:10H指数:2
导出分析报告
供职机构:东北电力大学信息工程学院更多>>
发文主题:蚁群算法Q学习多AGENT轮盘Q值更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《计算机工程与设计》《计算机工程与应用》更多>>
所获基金:吉林省科技发展计划基金教育部科学技术研究重点项目更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-2
视图:
排序:
多Agent Q学习几点问题的研究及改进被引量:5
《计算机工程与设计》2009年第9期2274-2276,共3页孟祥萍 王圣镔 王欣欣 
教育部科学技术研究基金项目(206035);吉林省科技发展计划基金项目(20070530)
提出了一种新颖的基于Q-学习,蚁群算法和轮盘赌算法的多Agent强化学习。在强化学习算法中,当Agent数量增加到足够大时,就会出现动作空间灾难性问题,即:其交互困难,学习速度骤然下降。另外,由于Agent是利用Q值来选择下一步动作的,因此,...
关键词:多Agent强化学习算法 蚁群算法 轮盘赌算法 Q值 动作空间灾难 
基于蚁群算法和轮盘算法的多Agent Q学习被引量:5
《计算机工程与应用》2009年第16期60-62,共3页孟祥萍 王圣镔 王欣欣 
吉林省科技发展计划项目(No.20070530)~~
提出了一种新颖的基于Q-学习、蚁群算法和轮盘赌算法的多Agent强化学习。在强化学习算法中,当Agent数量增加到足够大时,就会出现动作空间灾难性问题,即:其学习速度骤然下降。另外,Agent是利用Q值来选择下一步动作的,因此,在学习早期,动...
关键词:多Agent强化学习算法 蚁群算法 轮盘赌算法 
检索报告 对象比较 聚类工具 使用帮助 返回顶部