国家自然科学基金(61074058)

作品数:11被引量:27H指数:2
导出分析报告
相关作者:仵博郑红燕冯延蓬吴敏孟宪军更多>>
相关机构:中南大学深圳职业技术学院更多>>
相关期刊:《信息与控制》《计算机应用与软件》《计算机工程》《自动化学报》更多>>
相关主题:多智能体系统部分可观察马尔可夫决策过程信念POMDP无线传感器网络更多>>
相关领域:自动化与计算机技术电子电信更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
联合连通条件下的二阶多智能体系统有限时间一致性控制被引量:17
《控制理论与应用》2014年第7期981-986,共6页王芳 陈鑫 何勇 吴敏 
国家自然科学基金资助项目(61074058);国家杰出青年科学基金资助项目(61125301)
针对时变动态拓扑下无leader的二阶多智能体系统有限时间一致性控制问题,本文给出有限时间一致性协议,并对所提出的一致性协议进行理论分析.基于图论、Lyapunov稳定性理论、同次性理论和积分不等式方法,证明了当通信拓扑为联合连通时,...
关键词:多智能体系统 无领导者 有限时间一致性 时变动态拓扑 联合连通 
基于高斯回归的连续空间多智能体跟踪学习被引量:2
《自动化学报》2013年第12期2021-2031,共11页陈鑫 魏海军 吴敏 曹卫华 
国家自然科学基金(61074058)资助~~
提高适应性、实现连续空间的泛化、降低维度是实现多智能体强化学习(Multi-agent reinforcement learning,MARL)在连续系统中应用的几个关键.针对上述需求,本文提出连续多智能体系统(Multi-agent systems,MAS)环境下基于模型的智能体跟...
关键词:连续状态空间 多智能体系统 基于模型的强化学习 高斯回归 
认知无线电中一种n步串行信道感知策略被引量:1
《计算机工程与设计》2013年第8期2662-2667,2694,共7页郑红燕 冯延蓬 仵博 孟宪军 
国家自然科学基金项目(61074058);国家教育部博士点基金项目(20090162120068);广东省自然科学基金项目(S2011040004769)
为了提高频谱感知的整体性能,基于链路层多认知用户集中式协作感知思想,提出一种带缓冲区的双周期n步串行协作感知机制。该机制利用多认知用户分时、分段协作提高频谱感知效率,建立频谱池缩短被中断用户切换延迟时间,使用离散马尔可夫...
关键词:认知无线电 频谱感知 频谱池 协作感知 马尔可夫决策过程 
多智能体合作环境下的分布式强化学习
《华中科技大学学报(自然科学版)》2013年第S1期363-366,共4页傅波 陈鑫 何勇 吴敏 
国家自然科学基金资助项目(61074058)
针对多智能体完全合作环境下学习速度慢及收敛效果不佳问题,提出了基于分布式强化学习的二阶段适应学习方法,依次实现了智能体对环境的适应以及系统内部的协作.在第一阶段,智能体间的强化学习相互独立,以快速适应状态空间环境为主;该阶...
关键词:多智能体系统 强化学习 分布式学习 适应性 协作 
基于后验信念聚类的在线规划算法
《计算机工程》2013年第4期214-218,共5页仵博 吴敏 
国家自然科学基金资助项目(61074058);广东省自然科学基金资助项目(S2011040004769)
在连续状态的部分可观察马尔可夫决策过程中,在线规划无法同时满足高实时性与低误差的要求。为此,提出一种基于后验信念聚类的在线规划算法。使用KL散度分析连续状态下后验信念之间的误差,根据误差分析结果对后验信念进行聚类,利用聚类...
关键词:部分可观察马尔可夫决策过程 后验信念聚类 在线规划 KL散度 分支界限 
基于Markov决策过程的无线网络传输功率控制策略
《计算机测量与控制》2013年第3期703-705,共3页郑红燕 冯延蓬 仵博 
国家自然科学基金(61074058);广东省自然科学基金(S2011040004769)
针对同频AP在重复覆盖区域存在干扰问题,分析STA移动性和链路状态可观察的特点,引入概率论思想,提出一种基于Markov决策理论的单链路功率控制算法,通过构建单传输链路的状态集、动作集、状态转移函数模型及报酬函数模型,实现AP功率调整...
关键词:无线局域网 无线接入点 马尔可夫决策过程 传输功率控制 
基于信念点裁剪策略树的POMDP求解算法被引量:1
《信息与控制》2013年第1期53-57,共5页郑红燕 仵博 冯延蓬 孟宪军 
国家自然科学基金资助项目(61074058);广东省自然科学基金资助项目(S2011040004769)
针对大规模部分可观察马尔可夫决策过程(POMDP)算法中策略树规模指数级增长、已证信念点(witness point,WP)求解困难的问题,根据策略树值函数是分段线性凸函数的特点,提出一种基于信念点的策略树增量裁剪和值迭代求解算法.在策略树生成...
关键词:部分可观察马尔科夫决策过程(POMDP) 策略树 信念状态 基于点 增量裁剪 
WSN中一种目标追踪在线节点调度算法被引量:1
《计算机工程》2012年第11期96-99,103,共5页冯延蓬 仵博 郑红燕 孟宪军 
国家自然科学基金资助项目(61074058);广东省自然科学基金资助项目(S2011040004769)
针对目标追踪无线传感器网络节点能量有限、感知信息存在不确定性等问题,提出一种基于部分可观察马尔可夫决策过程的在线节点调度算法。通过状态转移函数和观察函数描述移动目标的不确定性,根据奖赏函数平衡追踪性能和节点能量消耗,并...
关键词:目标追踪 无线传感器网络 部分可观察马尔可夫决策过程 节点调度 可达信念与或树 在线算法 
基于FPOMDP的无线传感器网络动态调度算法被引量:1
《计算机应用与软件》2012年第8期55-58,77,共5页冯延蓬 仵博 郑红燕 
国家自然科学基金项目(61074058);广东省自然科学基金项目(S2011040004769)
针对无线传感器网络节点能量有限、数据采集易受环境影响的问题,提出一种基于可分解部分可观察Markov决策过程FPOMDP(Factored Partially Observable Markov Decision Process)的节点休眠调度算法。通过节点空时相关模型求取休眠节点数...
关键词:无线传感器网络 可分解部分可观察Markov决策过程 空时相关模型 
异构无线传感器网络中基于POMDP的实时调度算法被引量:2
《仪表技术与传感器》2012年第8期101-104,共4页冯延蓬 仵博 郑红燕 
国家自然科学基金项目(61074058);广东省自然科学基金项目(S2001040004769)
针对异构无线传感器网络节点性能存在差异和易受环境影响的特点,提出一种基于部分可观察Markov决策过程(partially observable markov decision process,POMDP)的实时休眠调度算法,使用状态转移函数和观察函数表示系统完成用户请求任务...
关键词:异构无线传感器网络 部分可观察Markov决策过程 调度 
检索报告 对象比较 聚类工具 使用帮助 返回顶部