部分可观察马尔可夫决策过程

作品数:27被引量:48H指数:3
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:仵博郑红燕冯延蓬吴敏孟宪军更多>>
相关机构:中南大学深圳职业技术学院合肥工业大学哈尔滨工业大学更多>>
相关期刊:《计算机应用研究》《智能系统学报》《传感器与微系统》《兵工学报》更多>>
相关基金:国家自然科学基金广东省自然科学基金国家教育部博士点基金国家高技术研究发展计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于近端策略优化算法和Mask-TIT网络的多功能雷达干扰决策方法
《数据采集与处理》2024年第6期1355-1369,共15页娄雨璇 孙闽红 尹帅 
为应对愈加智能的多功能雷达给对抗方带来的挑战,本文提出一种基于近端策略优化(Proximal policy optimization,PPO)算法和Mask?TIT(Mask?Transformer in Transformer)网络的干扰决策方法。首先,从一种现实场景出发,将干扰机与雷达的对...
关键词:雷达干扰决策 部分可观察马尔可夫决策过程 强化学习 TRANSFORMER 近端策略优化 
不确定性环境下的自动驾驶汽车行为决策方法被引量:1
《汽车工程》2024年第2期211-221,259,共12页付新科 蔡英凤 陈龙 王海 刘擎超 
国家重点研发计划(2022YFB2503302);国家自然科学基金(52225212,U20A20333,U20A20331,52072160);江苏省重点研发项目(BE2020083-3)资助。
在真实驾驶环境中,由于感知数据的噪声和其他交通参与者难以预测的行为意图,自动驾驶汽车如何在高度交互的复杂驾驶环境中考虑不确定性因素的影响,做出合理的决策,是当前决策规划系统须解决的主要问题之一。本文提出了一种不确定性环境...
关键词:自动驾驶汽车 行为决策 部分可观察马尔可夫决策过程 复杂网络 
基于改进MADDPG的UAV轨迹和计算卸载联合优化算法被引量:1
《计算机系统应用》2023年第11期203-211,共9页苏维亚 徐飞 王森 
航天高可信嵌入式软件工程技术实验室基金;西安市碑林区科技计划(GX2137)。
在地震、台风、洪水、泥石流等造成严重破坏的灾区,无人机(unmanned aerial vehicle,UAV)可以作为空中边缘服务器为地面移动终端提供服务,由于单无人机有限的计算和存储能力,难以实时满足复杂的计算密集型任务.本文首先研究了一个多无...
关键词:移动边缘计算 多智能体 联合优化 深度强化学习 部分可观察马尔可夫决策过程 计算卸载 
一种基于部分可观察马尔可夫决策过程的股票交易策略
《东莞理工学院学报》2023年第1期43-50,共8页黄福威 张宁 
广东省基础与应用基础研究基金(2022A1515010088)。
近年来涌现了许多把深度强化学习应用到股票交易策略的研究。深度强化学习通常依赖于马尔可夫决策过程建模,但是股票市场中交易策略的制定需要考虑历史交易数据中包含的信息。因此,本文通过部分可观察马尔可夫决策过程对股票市场建模,...
关键词:股票交易 部分可观察马尔可夫决策过程 优势演员评论家算法 
一种无人车无信号保护路口左转规划方法
《合肥工业大学学报(自然科学版)》2022年第5期665-672,共8页夏志远 黄妙华 李其仲 
国家重点研发计划资助项目(2018YFC0808405);政府间国际科技创新合作重点专项资助项目(SQ2018YFGH000405);中央高校基本科研业务费资助项目(205207002)。
为解决无人驾驶车辆在无信号保护路口左转规划中高效性与安全性相矛盾的问题,文章参考路径-速度解耦规划思路,提出一种左转规划区对角线分割(diagonal division of the planning area of left turns,DDPALT)的路径生成方法,结合基于部...
关键词:无人驾驶车辆 无信号路口 左转规划 交通安全 部分可观察马尔可夫决策过程(POMDP) 
POMDP在住院2型糖尿病治疗方案优化研究中的应用被引量:1
《今日药学》2017年第9期632-634,648,共4页杨帆 李海英 许少杰 邹兆重 李忆琴 陈画虹 
中山市科技计划项目(2015B1180)
目的探讨部分可观察马尔可夫决策过程(POMDP)在住院2型糖尿病治疗方案优化研究中的应用问题。方法回顾性分析某院2012~2016年住院治疗的650例2型糖尿病患者的相关生化指标及临床用药数据等资料。采用MATLAB R2014a进行POMDP挖掘分析,以...
关键词:部分可观察马尔可夫决策过程 住院2型糖尿病 治疗方案 优化 
基于部分可观察马尔可夫决策过程的受控无线网络系统动态资源分配被引量:2
《高技术通讯》2017年第3期220-227,共8页李萌 司鹏搏 孙恩昌 张延华 
国家自然科学基金(61372089;61571021;61671029)资助项目
研究了受控无线网络的动态资源分配。针对传统无线通信传输模型的局限性随着无线通信系统架构的发展日益凸显的问题,提出了一种引入反馈控制策略的受控无线网络模型。该模型结合部分可观察马尔可夫决策过程(POMDP),将用户接收功率与数...
关键词:受控网络 反馈策略 资源分配 部分可观察马尔可夫决策过程(POMDP) 
基于部分可观察马尔可夫决策过程的机电装备动态可靠性评价方法被引量:4
《中国机械工程》2016年第18期2482-2486,2493,共6页张红旗 邵晓东 胡祥涛 
国防技术基础项目(JSZL2014210B001;JSBZ2014210A005;JSBZ2014210B007);国防基础科研项目(A1120131044)
针对机电装备运行维护问题,提出了基于部分可观察马尔可夫决策过程(POMDP)理论的动态可靠性评价方法。该方法将可靠性动态演变看成POMDP问题,通过不完全观测到的设备运行信息(如噪声、温度、压力等),对可靠性状态进行估计,同时分析不同...
关键词:可靠性评价 维护策略 POMDP 机电装备 
基于部分可观察马尔可夫决策过程的多被动传感器组网协同反隐身探测任务规划被引量:12
《兵工学报》2015年第4期731-743,共13页万开方 高晓光 李波 梅军峰 
全国高等院校博士学科点专项科研基金项目(20116102110026);空军装备预先研究项目(402040103);西北工业大学基础研究基金项目(JC201144);西北工业大学科研启动基金项目(GAKY300701)
针对反隐身作战需求,提出多被动传感器组网协同战术。为提升反隐身探测效能,引入部分可观察马尔可夫决策过程(POMDP)理论,分析了POMDP任务规划要素,建立起多被动传感器组网协同反隐身探测任务规划POMDP模型。建立了多被动传感器协同控...
关键词:控制科学与技术 传感器技术 反隐身 多传感器组网 部分可观察马尔可夫决策过程 信念状态 任务规划 
基于非负矩阵分解更新规则的部分可观察马尔可夫决策过程信念状态空间降维算法被引量:1
《电子与信息学报》2013年第12期2901-2907,共7页仵博 陈鑫 郑红燕 冯延蓬 
国家自然科学基金(61074058;60874042);国家教育部博士点基金(20090162120068);广东省自然科学基金(S2011040004769);深圳市自然科学基金(JCYJ20120617134831736)资助课题
针对求解部分可观察马尔可夫决策过程(POMDP)规划问题时遭遇的"维数诅咒",该文提出了一种基于非负矩阵分解(NMF)更新规则的POMDP信念状态空间降维算法,分两步实现低误差高维降维。第1步,利用POMDP的结构特性,将状态、观察和动作进行可...
关键词:信息处理 部分可观察马尔可夫决策过程 信念状态空间 非负矩阵分解 值直接压缩 维数灾 
检索报告 对象比较 聚类工具 使用帮助 返回顶部