苗国英

作品数:11被引量:24H指数:3
导出分析报告
供职机构:南京信息工程大学更多>>
发文主题:多智能体自适应多智能体系统控制律编队控制更多>>
发文领域:自动化与计算机技术兵器科学与技术天文地球更多>>
发文期刊:《遥感信息》《电光与控制》《电子信息对抗技术》《控制工程》更多>>
所获基金:国家自然科学基金江苏省“333”工程基金项目江苏省高校自然科学研究项目更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
优先价值网络的多智能体协同强化学习算法
《控制工程》2025年第4期691-698,共8页苗国英 孙英博 王慧琴 
国家自然科学基金资助项目(62073169)。
为了提高多智能体系统的智能决策能力,针对多智能体强化学习的经验回放存在的弊端,以及智能体决策强调动作值而忽略状态值等问题,提出一种基于优先价值网络的多智能体强化学习算法。首先,该算法引入优先经验回放机制,根据重要性权重进...
关键词:多智能体 强化学习 优先经验回放 价值优势网络 状态值 
基于编解码网络的SAR影像建筑物提取被引量:1
《遥感信息》2024年第2期127-134,共8页苗国英 王慧琴 张恩伟 
国家自然科学基金(62073169);江苏省“333工程”项目(BRA2020067)。
针对合成孔径雷达(synthetic aperture radar,SAR)遥感图像中出现的散斑噪声和几何畸变对建筑物提取过程造成干扰的问题,提出了一种多尺度特征注意力融合(multi-scale feature attention fusion,MSFAF)网络。首先,结合深度神经网络和SA...
关键词:SAR遥感图像 建筑物提取 多尺度特征 注意力融合 神经网络 
基于改进的深度强化学习多智能体协作方法被引量:4
《传感器与微系统》2023年第9期25-29,共5页孙英博 苗国英 庄亚楠 
国家自然科学基金资助项目(62073169);江苏省“333工程”项目(BRA2020067)。
针对多智能体深度强化学习在值函数拟合过程中未充分考虑智能体之间的作用关系,且动作大概率随机,导致迭代试错过程的数据浪费、协作效率低、收敛速度慢等问题,提出了一种在协作中的平均权重机制和改进的探索策略。首先,利用平均深度Q...
关键词:多智能体 深度强化学习 平均权重 协作 策略 
基于多智能体强化学习值分解的优化算法被引量:3
《电子测量技术》2023年第7期73-79,共7页王慧琴 苗国英 孙英博 
国家自然科学基金(62073169);江苏省“333工程”项目(BRA2020067)资助。
当前多智能体强化学习在值分解的算法中无法充分考虑到多智能体间的协作关系,并且使用的随机策略在探索过程中容易出现越过最优点,陷入局部最优解的情况。针对以上问题,本文提出了一种深度交流多智能体强化学习算法。本文通过使用卷积...
关键词:多智能体 强化学习 深度交流 探索策略 
基于扰动观测器的机械臂阻抗复合控制研究被引量:1
《南京信息工程大学学报(自然科学版)》2023年第2期225-230,共6页张明瑞 苗国英 姜琛 
江苏省第五期“333工程”科研项目(BRA2020067);国家自然科学基金(62073169)。
针对机械臂系统模型中存在未知扰动的问题,提出了基于扰动观测器的机械臂阻抗复合控制方法.针对二阶阻抗动态模型,采用由扰动观测器(DOB)、阻抗控制器和位置控制器构成的复合控制策略,其中扰动观测器用来估计机械臂模型中的未知扰动,阻...
关键词:机械臂 阻抗控制 扰动观测器 位置控制 
基于事件触发的多无人机群快速编队控制被引量:3
《电子信息对抗技术》2022年第6期48-53,共6页庄亚楠 苗国英 孙英博 
国家自然科学基金项目(62073169);江苏省“333工程”项目(BRA2020067)。
在有向拓扑结构下,针对无人机之间存在通信噪声干扰,研究了基于事件触发的多无人机群快速编队控制。为了节约无人机的能量和通信成本,运用事件触发方法,使无人机间仅在触发时刻进行通信。为了加快多无人机系统的编队速度,利用无人机自...
关键词:多智能体系统 分布式控制 噪声干扰 快速编队 事件触发 四旋翼无人机 
基于UA-QMIX的价值函数分解方法研究
《计算机仿真》2022年第11期448-452,共5页纪龙 苗国英 李涛 张静怡 
江苏省“333工程”项目(BRA2020067);国家自然科学基金(62073169)。
针对智能体通信时受外界信息轰炸、协作式多智能体在训练初期的无效探索等问题,提出一种改进的UA-QMIX算法。通过价值函数分解理论和集中式学习分布式执行作为基本条件,在智能体效用网络中加入注意力机制,增强智能体之间对彼此影响力的...
关键词:强化学习 多智能体 深度学习 注意力机制 
DoS攻击下异质多智能体系统二分包含控制被引量:1
《电光与控制》2022年第3期27-32,80,共7页张静怡 苗国英 纪龙 
国家自然科学基金(61973169);江苏省“333工程”项目(BRA2020067)。
为解决DoS攻击下智能体间不能正常通信的问题,研究了基于符号图的离散异质多智能体系统包含控制。首先,考虑跟随者状态不能在线获得的情况,构造分布式状态观测器;其次,在每个跟随者的控制器设计中加入历史时刻信息,提出分布式动态反馈...
关键词:多智能体系统 符号网络 DOS攻击 包含控制 观测器 
应对快速移动障碍物的多无人机编队避障控制被引量:3
《兵器装备工程学报》2021年第3期142-148,156,共8页刘云平 徐泽 赵中原 苗国英 邓志良 李炳志 
国家重点研发计划(2018YFC1405703);国家自然科学基金项目(51875293);电子信息控制重点实验室开放基金项目(6142105190308)。
通过引入与障碍物移动方向垂直的辅助牵引加速度信息,消除陷入局部最优化解,提高了对移动障碍物的规避能力。将有限时间一致性算法与改进的人工势场方法相结合,提出一种多无人机有限时间编队和避障控制策略,可实现多无人机快速编队和避...
关键词:一致性算法 人工势场方法 多无人机 编队控制 避障控制 
基于观测器的多智能体系统的有限时间包含控制被引量:1
《计算机测量与控制》2021年第2期92-97,共6页张静怡 苗国英 纪龙 
国家自然科学基金(61973169,61973170);国家重点研发计划资助(2018YFC1405703)。
在固定有向拓扑结构下,研究了具有多个静态或动态领导者的多智能体有限时间包含控制问题;假设领导者之间不存在信息的交互,提出基于快速终端滑模的控制算法,该算法驱使跟随者的运动轨迹在有限时间收敛到由领导者组成的凸包中;进一步,考...
关键词:多智能体系统 有限时间控制 滑模控制 观测器 
检索报告 对象比较 聚类工具 使用帮助 返回顶部