国家教育部博士点基金(20090162120068)

作品数:10被引量:11H指数:2
导出分析报告
相关作者:吴敏仵博郑红燕冯延蓬陈鑫更多>>
相关机构:中南大学深圳职业技术学院湖南财政经济学院更多>>
相关期刊:《计算机工程与设计》《控制理论与应用》《电信科学》《模式识别与人工智能》更多>>
相关主题:部分可观察马尔可夫决策过程信念克隆选择算法克隆选择免疫记忆更多>>
相关领域:自动化与计算机技术电子电信更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于非负矩阵分解更新规则的部分可观察马尔可夫决策过程信念状态空间降维算法被引量:1
《电子与信息学报》2013年第12期2901-2907,共7页仵博 陈鑫 郑红燕 冯延蓬 
国家自然科学基金(61074058;60874042);国家教育部博士点基金(20090162120068);广东省自然科学基金(S2011040004769);深圳市自然科学基金(JCYJ20120617134831736)资助课题
针对求解部分可观察马尔可夫决策过程(POMDP)规划问题时遭遇的"维数诅咒",该文提出了一种基于非负矩阵分解(NMF)更新规则的POMDP信念状态空间降维算法,分两步实现低误差高维降维。第1步,利用POMDP的结构特性,将状态、观察和动作进行可...
关键词:信息处理 部分可观察马尔可夫决策过程 信念状态空间 非负矩阵分解 值直接压缩 维数灾 
认知无线电中一种n步串行信道感知策略被引量:1
《计算机工程与设计》2013年第8期2662-2667,2694,共7页郑红燕 冯延蓬 仵博 孟宪军 
国家自然科学基金项目(61074058);国家教育部博士点基金项目(20090162120068);广东省自然科学基金项目(S2011040004769)
为了提高频谱感知的整体性能,基于链路层多认知用户集中式协作感知思想,提出一种带缓冲区的双周期n步串行协作感知机制。该机制利用多认知用户分时、分段协作提高频谱感知效率,建立频谱池缩短被中断用户切换延迟时间,使用离散马尔可夫...
关键词:认知无线电 频谱感知 频谱池 协作感知 马尔可夫决策过程 
Cooperative learning with joint state value approximation for multi-agent systems被引量:1
《控制理论与应用(英文版)》2013年第2期149-155,共7页Xin CHEN Gang CHEN Weihua CAO Min WU 
supported by National Nature Science Foundation of China(Nos.61074058,60874042);the Chinese Postdoctoral Science Foundation(No.200902483);the Specialized Research Fund for the Doctoral Program of Higher Education of China(No.20090162120068);the Central South University Innovation Project(No.2011ssxt221)
This paper relieves the 'curse of dimensionality' problem, which becomes intractable when scaling rein- forcement learning to multi-agent systems. This problem is aggravated exponentially as the number of agents inc...
关键词:Multi-agent system Q-LEARNING Cooperative system Curse of dimensionality DECOMPOSITION 
基于Monte Carlo粒子滤波的POMDPs在线算法被引量:1
《控制与决策》2013年第6期925-929,共5页仵博 吴敏 
国家自然科学基金项目(61074058;60874042);教育部博士点基金项目(20090162120068);广东省自然科学基金项目(S2011040004769)
针对部分可观察马尔可夫决策过程(POMDPs)的信念状态空间是一个双指数规模问题,提出一种基于Monte Carlo粒子滤波的POMDPs在线算法.首先,分别采用粒子滤波和粒子映射更新和扩展信念状态,建立可达信念状态与或树;然后,采用分支界限裁剪...
关键词:部分可观察马尔可夫决策过程 信念状态 MONTE Carlo 粒子滤波 在线算法 
认知无线电中基于特征信念的协作频谱检测算法
《电信科学》2013年第2期89-94,共6页郑红燕 仵博 冯延蓬 孟宪军 
国家自然科学基金资助项目(No.61074058;No.60874042);国家教育部博士点基金资助项目(No.20090162120068);广东省自然科学基金资助项目(No.S2011040004769)
针对认知无线网络(CRN)中频谱检测准确性与检测效率难以平衡的问题,本文提出一种特征信念的认知无线网络ED/FD协作频谱检测算法。通过单认知用户能量检测与特征信号检测协作模式代替多认知用户协作检测模式,降低通信开销,利用部分可观...
关键词:认知无线网络 频谱检测 能量检测 特征检测 部分可观察马尔可夫决策过程 
基于点的POMDPs在线值迭代算法被引量:3
《软件学报》2013年第1期25-36,共12页仵博 吴敏 佘锦华 
国家自然科学基金(61074058;60874042);国家教育部博士点基金(20090162120068)
部分可观察马尔可夫决策过程(partially observable Markov decision processes,简称POMDPs)是动态不确定环境下序贯决策的理想模型,但是现有离线算法陷入信念状态"维数灾"和"历史灾"问题,而现有在线算法无法同时满足低误差与高实时性...
关键词:部分可观察马尔可夫决策过程 信念状态 基于点的算法 在线算法 与或树 
基于信念重用的WSNs能量高效跟踪
《传感器与微系统》2012年第8期30-33,共4页仵博 吴敏 郑红燕 冯延蓬 
国家自然科学基金资助项目(61074058;60874042);国家教育部博士点基金资助项目(20090162120068);广东省自然科学基金资助项目(S2011040004769)
针对无线传感器网络(WSNs)中目标跟踪性能与传感器能量消耗难以平衡问题,提出一种信念重用的WSNs能量高效跟踪算法。使用部分可观察马尔可夫决策过程(POMDPs)对动态不确定环境下的WSNs进行建模,将跟踪性能与能量消耗平衡优化问题转化为P...
关键词:无线传感器网络 能量高效跟踪 信念重用 部分可观察马尔可夫决策过程 
基于概率模型的动态分层强化学习被引量:2
《控制理论与应用》2011年第11期1595-1600,1606,共7页戴朝晖 袁姣红 吴敏 陈鑫 
国家自然科学基金资助项目(60874042);中国博士后科学基金一等资助项目(20080440177);中国博士后科学基金特别资助项目(200902483);教育部高等学校博士点基金新教师基金资助项目(20090162120068)
为解决大规模强化学习中的"维度灾难"问题,克服以往学习算法的性能高度依赖于先验知识的局限性,本文提出一种基于概率模型的动态分层强化学习方法.首先基于贝叶斯学习对状态转移概率进行建模,建立基于概率参数的关键状态识别方法,进而...
关键词:动态分层强化学习 贝叶斯学习 状态转移概率模型 智能体 
基于等级变异的克隆选择算法被引量:2
《模式识别与人工智能》2011年第3期438-443,共6页宋丹 赖旭芝 吴敏 
国家自然科学基金项目(No.60874042);高等学校博士学科点专项科研基金新教师基金项目(No.20090162120068)资助
提出一种克隆选择算法——基于等级变异的克隆选择算法.为提高进化中变异的有效性,算法将变异尺度分成若干等级,低等级变异有利于跳出局部最优解,实现全局寻优;高等级变异有利于局部的高精度寻优.此外,算法在进化过程中记忆父抗体的变...
关键词:免疫记忆 克隆选择 等级变异 全局优化 
基于变异记忆矩阵的克隆选择算法
《控制与决策》2011年第3期428-432,共5页宋丹 赖旭芝 吴敏 张传科 
国家自然科学基金项目(60874042);高等学校博士学科点专项科研基金新教师基金项目(20090162120068).
利用免疫系统的免疫记忆机制,提出一种适于函数优化的基于变异记忆矩阵的克隆选择算法.首先,利用变异记忆矩阵保存进化中有用的变异信息,以引导抗体的克隆和变异操作,加强局部搜索能力;然后,利用当代种群的综合信息生成新抗体进入种群,...
关键词:免疫记忆 克隆选择 变异记忆矩阵 全局优化 
检索报告 对象比较 聚类工具 使用帮助 返回顶部