赵昀

作品数:4被引量:9H指数:2
导出分析报告
供职机构:南京理工大学更多>>
发文主题:强化学习算法MAS多智能体信息熵集散式控制更多>>
发文领域:自动化与计算机技术航空宇航科学技术更多>>
发文期刊:《计算机仿真》《电光与控制》《南京理工大学学报》《系统工程与电子技术》更多>>
所获基金:国家教育部博士点基金国家自然科学基金江苏省自然科学基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-4
视图:
排序:
基于状态敏感度的移动机器人路径规划
《南京理工大学学报》2012年第1期7-11,共5页赵昀 陈庆伟 胡维礼 
国家自然科学基金(60975075);江苏省自然科学基金(BK2008404)
针对未知环境下的移动机器人系统,研究了使机器人能同时躲避静态和动态障碍物、且快速抵达目标的路径规划问题。首先通过定义一种新的状态敏感度测度,度量状态与目标之间的关联程度,指导机器人对环境的自主探索方向和力度,进而利用强化...
关键词:移动机器人 路径规划 强化学习 状态敏感度 
一种基于信息熵的强化学习算法被引量:4
《系统工程与电子技术》2010年第5期1043-1046,共4页赵昀 陈庆伟 胡维礼 
教育部博士学科点专项科研基金(20070288022);江苏省自然科学基金(BK2008404);空间智能控制技术国家级重点实验室资助课题
针对强化学习中探索和利用之间的平衡控制问题,提出了一种基于信息熵的强化学习算法。该算法利用信息熵的概念,定义了一种新的状态重要性测度,度量了状态与目标之间的关联程度,据此设计了一种探索机制,用于自适应调节学习过程中探索和...
关键词:强化学习 探索和利用 动作选择 信息熵 
分阶Dyna强化学习算法
《计算机仿真》2009年第7期154-158,共5页赵昀 陈庆伟 胡维礼 
国家自然科学基金项目(60474019);博士点基金项目(20070288022)
针对现有Dyna强化学习体系结构下,"规划"和"学习"在计算资源分配上的不合理问题,提出了一种分阶Dyna体系结构,随着经验知识的不断积累,将学习过程划分为探索阶段、变比重学习阶段和优化阶段,分别进行"规划"和"学习"的协调控制,大大减少...
关键词:强化学习 强化学习体系结构 规划 
基于MAS的多无人机系统集散式控制体系结构研究被引量:5
《电光与控制》2009年第6期1-4,共4页赵昀 李胜 陈庆伟 胡维礼 
国家自然科学基金(60174019);博士点基金(20070288022)
多无人机协同作战是未来空战的主要模式。将多无人机协同作战问题看作复杂的动态协作问题,利用多智能体技术建立多无人机系统的集散式控制体系结构。探讨了在所提出的控制体系结构下,系统能够快速应对各种突发战况,进行组织结构的重构,...
关键词:多无人机 协同作战 多智能体 控制体系结构 
检索报告 对象比较 聚类工具 使用帮助 返回顶部