刘磊

作品数:9被引量:26H指数:4
导出分析报告
供职机构:河海大学理学院更多>>
发文主题:事件触发一致性多智能体系统自适应动态规划仿真更多>>
发文领域:自动化与计算机技术理学电气工程更多>>
发文期刊:《计算机仿真》《南通大学学报(自然科学版)》《应用数学和力学》《华中科技大学学报(自然科学版)》更多>>
所获基金:国家自然科学基金中国博士后科学基金江苏省博士后科研资助计划项目中央高校基本科研业务费专项资金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-9
视图:
排序:
基于PPO算法的四旋翼无人机位置控制
《计算机仿真》2024年第2期462-467,521,共7页杨宗月 刘磊 刘晨 
国家自然科学基金(61773152)。
针对四旋翼无人机的悬停控制及轨迹跟踪问题,利用近端策略优化算法来控制四旋翼飞行器,通过强化学习训练神经网络,将状态直接映射到四个旋翼,是一种用于在未知动态参数和干扰下控制任何线性或非线性系统的技术。基于回报塑形技术(The re...
关键词:无人机 四旋翼 强化学习 位置控制 近端策略优化 
基于间歇事件触发牵制控制的多智能体系统的有界性
《南通大学学报(自然科学版)》2023年第4期25-32,共8页朱润玉 刘磊 
江苏省研究生科研与实践创新计划项目(KYCX21-0453)。
针对具有扰动的多智能体系统难以在有限时间内收敛到有界范围内的问题,采用两种间歇事件触发牵制控制,探讨了多智能体系统的有限时间有界性。通过间歇事件触发牵制控制、Lyapunov方法以及不等式放缩技巧,建立了多智能体系统有限时间有...
关键词:多智能体系统 事件触发控制 间歇控制 牵制控制 有限时间有界性 
基于注意力机制的A3C量化交易策略
《南通大学学报(自然科学版)》2023年第2期43-49,74,共8页符甲鑫 刘磊 钱成 
国家自然科学基金面上项目(61773152)。
针对传统交易策略无法有效长期消除市场噪声和非线性影响的问题,提出一种基于注意力机制的异步优势动作评价(squeeze-and-excitation asynchronous advantage actor-critic,SE-A3C)量化交易策略。以历史技术指标因子为环境状态,利用卷...
关键词:深度强化学习 异步优势动作评价 注意力机制 定量交易 
基于值分布最大熵Actor-Critic算法的投资组合管理被引量:5
《华中科技大学学报(自然科学版)》2023年第5期26-32,共7页刘磊 陈浩 
国家自然科学基金面上项目(61773152).
针对投资组合管理问题,提出一种基于值分布强化学习算法(VD-MEAC)的投资组合框架.首先,以投资组合收益最大化为目标建立强化学习框架,智能体的动作就是投资组合的权重变化;然后,选择股票因子做为智能体观察到的状态信息.在算法设计上通...
关键词:值分布强化学习 投资组合管理 量化投资 因子模型 深度学习 
安全屏障机制下基于SAC算法的机器人导航系统被引量:2
《南京信息工程大学学报(自然科学版)》2023年第2期201-209,共9页马丽新 刘磊 刘晨 
国家自然科学基金(61773152)。
为了提高移动机器人自主导航系统的智能化水平和安全性,设计了安全屏障机制下基于SAC(Soft Actor-Critic)算法的自主导航系统,并构建了依赖于机器人与最近障碍物距离、目标点距离以及偏航角的回报函数.在Gazebo仿真平台中,搭建载有激光...
关键词:移动机器人 SAC算法 安全屏障机制 激光雷达 自主导航 Gazebo 
基于输出层具有噪声的DQN的无人车路径规划被引量:5
《应用数学和力学》2023年第4期450-460,共11页李杨 闫冬梅 刘磊 
国家自然科学基金(面上项目)(61773152)。
在DQN算法的框架下,研究了无人车路径规划问题.为提高探索效率,将处理连续状态的DQN算法加以变化地应用到离散状态,同时为平衡探索与利用,选择仅在DQN网络输出层添加噪声,并设计了渐进式奖励函数,最后在Gazebo仿真环境中进行实验.仿真...
关键词:深度强化学习 无人车 DQN算法 Gauss噪声 路径规划 Gazebo仿真 
基于actor-critic算法的分数阶多自主体系统最优主-从一致性控制被引量:4
《应用数学和力学》2022年第1期104-114,共11页马丽新 刘晨 刘磊 
国家自然科学基金(面上项目)(61773152);中央高校基本科研业务费(2019B19214)。
研究了分数阶多自主体系统的最优主-从一致性问题.在考虑控制器周期间歇的前提下,将分数阶微分的一阶近似逼近式、事件触发机制和强化学习中的actor-critic算法有机整合,设计了基于周期间歇事件触发策略的强化学习算法结构.最后,通过数...
关键词:分数阶多自主体系统 actor-critic算法 最优主-从一致性 事件触发 间歇 
基于事件触发策略的多智能体系统的最优主-从一致性分析被引量:10
《应用数学和力学》2019年第11期1278-1288,共11页刘晨 刘磊 
国家自然科学基金(面上项目)(61773152);中国博士后科学基金(2016M601698;2017T100318);江苏省博士后科学基金(面上项目)(1701078B)~~
研究了具有领导者的线性多智能体系统的主-从一致性问题.借助各智能体间的通讯拓扑所构成的无向图,提出一种基于事件触发的自适应动态规划方法,并使用神经网络的逼近性质设计出了近似最优控制.利用Lyapunov稳定性定理,分析了多智能体误...
关键词:多智能体系统 主-从一致性 事件触发 自适应动态规划 
控制器参数的可区分性分析及其在双馈风力发电系统的应用被引量:1
《中国科学:技术科学》2013年第11期1289-1298,共10页秦川 鞠平 吴峰 刘磊 
国家自然科学基金重点(批准号:51137002;51190102);江苏省自然科学基金重点研究专项(批准号:BK2011026)资助项目
电力系统中许多控制器的参数众多,所提出的可区分性是指在参数的优化整定过程中,能否唯一确定某个参数,也即最优解的唯一性.由于在大多数情况下,无法获得优化目标与控制器参数之间的解析关系,这时要靠解析方法分析可区分性就非常困难.为...
关键词:控制器参数 优化 可区分性 轨迹灵敏度 双馈异步风力发电机 
检索报告 对象比较 聚类工具 使用帮助 返回顶部