吉林省科技发展计划基金(20070530)

作品数:3被引量:10H指数:2
导出分析报告
相关作者:孟祥萍王圣镔王欣欣赵栩更多>>
相关机构:长春工程学院东北电力大学更多>>
相关期刊:《计算机工程与设计》《计算机工程与应用》更多>>
相关主题:蚁群算法Q学习多AGENT轮盘Q值更多>>
相关领域:自动化与计算机技术更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-3
视图:
排序:
基于DRNN自适应反馈补偿控制器设计与应用
《微计算机信息》2009年第10期67-69,共3页赵栩 孟祥萍 
基金申请人:孟祥萍;项目名称:先进控制理论及其在冶金企业中的应用;基金颁发部门:吉林省科技发展计划项目(20070530)
在轧钢控制系统中,由于轧机两侧液压压下系统的不一致会导致带材横向厚度差分布不均匀,直接影响带材的板形质量,针对此问题,本文提出将对角递归网络自适应PID控制器用于反馈回路中的补偿控制方案,用以提高轧机两侧压下动态同步的品质。...
关键词:液压伺服 对角递归网络 板形控制 递推预报误差算法 
多Agent Q学习几点问题的研究及改进被引量:5
《计算机工程与设计》2009年第9期2274-2276,共3页孟祥萍 王圣镔 王欣欣 
教育部科学技术研究基金项目(206035);吉林省科技发展计划基金项目(20070530)
提出了一种新颖的基于Q-学习,蚁群算法和轮盘赌算法的多Agent强化学习。在强化学习算法中,当Agent数量增加到足够大时,就会出现动作空间灾难性问题,即:其交互困难,学习速度骤然下降。另外,由于Agent是利用Q值来选择下一步动作的,因此,...
关键词:多Agent强化学习算法 蚁群算法 轮盘赌算法 Q值 动作空间灾难 
基于蚁群算法和轮盘算法的多Agent Q学习被引量:5
《计算机工程与应用》2009年第16期60-62,共3页孟祥萍 王圣镔 王欣欣 
吉林省科技发展计划项目(No.20070530)~~
提出了一种新颖的基于Q-学习、蚁群算法和轮盘赌算法的多Agent强化学习。在强化学习算法中,当Agent数量增加到足够大时,就会出现动作空间灾难性问题,即:其学习速度骤然下降。另外,Agent是利用Q值来选择下一步动作的,因此,在学习早期,动...
关键词:多Agent强化学习算法 蚁群算法 轮盘赌算法 
检索报告 对象比较 聚类工具 使用帮助 返回顶部