赵学艳

作品数:4被引量:9H指数:2
导出分析报告
供职机构:华南理工大学自动化科学与工程学院更多>>
发文主题:网络算法网络结构网络QQ学习算法更多>>
发文领域:自动化与计算机技术理学更多>>
发文期刊:《华南理工大学学报(自然科学版)》《系统科学与数学》《南京信息工程大学学报》更多>>
所获基金:国家自然科学基金广东省自然科学基金广州市科技计划项目中央高校基本科研业务费专项资金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-4
视图:
排序:
基于Q学习算法的随机离散时间系统的随机线性二次最优追踪控制被引量:3
《南京信息工程大学学报(自然科学版)》2021年第5期548-555,共8页张正义 赵学艳 
国家自然科学基金(61873099,62073144);广东省自然科学基金(2020A1515010441);广州市科技计划(202002030158,202002030389)。
针对随机线性离散时间系统,利用Q学习算法求解无限时域的随机线性二次最优追踪控制(SLQT)问题.首先,假设通过命令生成器生成追踪所需的参考信号,并建立一个由原随机系统和参考轨迹系统组成的增广系统,把最优追踪问题转化为最优调节问题...
关键词:随机系统 Q学习算法 最优追踪控制 随机代数方程 
基于权重值的竞争深度双Q网络算法被引量:5
《南京信息工程大学学报(自然科学版)》2021年第5期564-570,共7页汪晨曦 赵学艳 郭新 
国家自然科学基金(61873099,62073144);广东省自然科学基金(2020A1515010441);广州市科技计划(202002030158,202002030389);广东省青年创新人才项目(2018GkQNCX005)。
在深度强化学习中,深度Q网络算法存在严重高估动作值问题,使得智能体的表现不尽人意.尽管深度双Q网络和竞争网络结构可以部分缓解高估带来的影响,但引入双Q网络的同时,有时也会低估动作值.本文提出了一种基于权重值的竞争深度双Q网络算...
关键词:深度强化学习 深度双Q网络 竞争网络结构 权重值 
基于局部Lipschitz条件的非线性It随机微分方程的基本理论(英文)被引量:1
《系统科学与数学》2016年第12期2164-2171,共8页赵学艳 邓飞其 杨启贵 
国家自然科学基金(61503142,61573156,61273126);中央高校基本科研业务费项目(x2zd-D2153620)资助课题
主要目的是在局部Lipschitz条件下建立非线性Ito随机微分方程的基本理论,包括解的存在性和非零性.过去文献中的局部Lipschitz条件被减弱为广义局部Lipschitz条件,其系数可以是局部、变系数、非线性的,在时间维上真正允许系数的时变性,...
关键词:Ito随机微分方程 局部LIPSCHITZ条件 存在性 非零性 
一般速率下马尔可夫调制随机系统的稳定性
《华南理工大学学报(自然科学版)》2012年第10期102-108,共7页邓飞其 旷世芳 赵学艳 
国家自然科学基金资助项目(61273126;60874114);广东省自然科学基金重点资助项目(10251064101000008)
一些稳定的随机系统是非指数稳定的,可能出现方程解收敛的速率较指数速率低的情况,如多项式或对数.为了更精确地定量分析系统的稳定性,文中将指数稳定概念推广到更一般稳定的衰减函数,研究了一类马尔可夫调制随机系统在一般衰减速率下...
关键词:马尔可夫链 φ(t)稳定 EulerMaruyama方法 随机系统 
检索报告 对象比较 聚类工具 使用帮助 返回顶部