国家自然科学基金(61304079)

作品数:4被引量:25H指数:3
导出分析报告
相关作者:魏庆来更多>>
相关机构:北京科技大学中国科学院自动化研究所更多>>
相关期刊:《控制工程》《自动化学报》《IEEE/CAA Journal of Automatica Sinica》《Chinese Physics B》更多>>
相关主题:ITERATIVE_METHODSCONTROL_THEORYCONSTRAINEDSELF-LEARNINGSEQUENTIAL更多>>
相关领域:自动化与计算机技术电气工程理学更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-4
视图:
排序:
强化学习在机器博弈上的应用综述被引量:4
《控制工程》2021年第10期1998-2004,共7页杜康豪 宋睿卓 魏庆来 
国家自然科学基金资助项目(61304079,61673054,61722312,61873300)。
人工智能是未来科技发展的必然趋势,将会对世界产生巨大的影响,而机器博弈更是人工智能研究的热点内容。目前,解决机器博弈问题最先进的算法都来源于强化学习。强化学习是机器学习最重要的方法之一,主要用来解决决策问题。它具有接近人...
关键词:强化学习 机器博弈 非完全信息博弈 围棋 德州扑克 DOTA2 
Optimal Constrained Self-learning Battery Sequential Management in Microgrid Via Adaptive Dynamic Programming被引量:17
《IEEE/CAA Journal of Automatica Sinica》2017年第2期168-176,共9页Qinglai Wei Derong Liu Yu Liu Ruizhuo Song 
supported in part by National Natural Science Foundation of China(61533017,61273140,61304079,61374105,61379099,61233001);Fundamental Research Funds for the Central Universities(FRF-TP-15-056A3);the Open Research Project from SKLMCCS(20150104)
This paper concerns a novel optimal self-learning battery sequential control scheme for smart home energy systems. The main idea is to use the adaptive dynamic programming U+0028 ADP U+0029 technique to obtain the opt...
关键词:Adaptive control systems Automation Battery management systems Control theory Electric batteries Energy management Energy management systems Intelligent buildings Iterative methods Number theory Secondary batteries 
Optimal Tracking Control for a Class of Unknown Discrete-time Systems with Actuator Saturation via Data-based ADP Algorithm被引量:4
《自动化学报》2013年第9期1413-1420,共8页SONG Rui-Zhuo XIAO Wen-Dong SUN Chang-Yin 
Supported by National Natural Science Foundation of China (61304079, 61125306, 61034002), the Open Research Project from SKLMCCS (20120106), the Fundamental Research Funds for the Central Universities (FRF-TP-13-018A), and the China Postdoctoral Science. Foundation (201_3M_ 5305_27)_ _ _
为有致动器浸透和未知动力学的分离时间的系统的一个班的一个新奇最佳的追踪控制方法在这份报纸被建议。计划基于反复的适应动态编程(自动数据处理) 算法。以便实现控制计划,一个 data-based 标识符首先为未知系统动力学被构造。由介绍...
关键词:最优跟踪控制 离散时间系统 饱和执行器 DP算法 控制方案 神经网络 性能指标 系统动力学 
Approximation-error-ADP-based optimal tracking control for chaotic systems with convergence proof
《Chinese Physics B》2013年第9期305-311,共7页宋睿卓 肖文栋 孙长银 魏庆来 
supported by the Open Research Project from SKLMCCS (Grant No. 20120106);the Fundamental Research Funds for the Central Universities of China (Grant No. FRF-TP-13-018A);the Postdoctoral Science Foundation of China (Grant No. 2013M530527);the National Natural Science Foundation of China (Grant Nos. 61304079, 61125306, and 61034002)
In this paper, an optimal tracking control scheme is proposed for a class of discrete-time chaotic systems using the approximation-error-based adaptive dynamic programming (ADP) algorithm. Via the system transformat...
关键词:chaotic systems approximation error adaptive dynamic programming optimal tracking control 
检索报告 对象比较 聚类工具 使用帮助 返回顶部