马尔可夫决策过程

作品数:416被引量:1725H指数:17
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:张一晋仵博陈前斌唐昊赵楠更多>>
相关机构:东南大学重庆邮电大学南京航空航天大学合肥工业大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家教育部博士点基金广东省自然科学基金中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于SMDP的安全防护基础设施网络切片服务响应模型
《计算机测量与控制》2025年第4期299-305,共7页王璐茜 葛洪武 朱晓明 贾哲 
在创建各种安全防护基础切片络切片的过程中,安全防护基础设施提供商主要负责响应切片服务请求和分配资源,但其切片资源有限,切片服务存在响应速度慢的问题;因此,针对安全防护基础设施提供商的服务决策过程,提出了一种基于半马尔可夫决...
关键词:安全防护基础设施 网络切片 半马尔可夫决策过程 安全防护基础设施提供商 服务响应模型 
动态电磁环境下多功能雷达一体化发射资源管理方案
《雷达学报(中英文)》2025年第2期456-469,共14页张鹏 严俊坤 高畅 李康 刘宏伟 
国家自然科学基金(62471356,62101350,62192714);中国航天科工集团第八研究院产学研合作(SAST2023-068)。
传统多功能雷达仅面向目标特性优化发射资源,在动态电磁环境下面临干扰智能时变、优化模型失配的问题。因此,该文提出一种基于数据驱动的一体化发射资源管理方案,旨在通过对动态干扰信息在线感知与利用提升多功能雷达在动态电磁环境下...
关键词:一体化发射资源管理 多目标跟踪 动态电磁环境 马尔可夫决策过程 优化问题 
感知系统受限下的城市低空无人机避障算法
《电子科技大学学报》2025年第2期257-265,共9页李安醍 李诚龙 郑远 
国家自然科学基金民航联合基金重点项目(U2333214);四川省自然科学基金(2023NSFSC0903);中央高校基本科研业务费专项资金(J2023-079);民航局安全能力建设项目(MHAQ2024033)。
针对物流无人机在城市低空复杂环境和高密度动态交通流下的避障决策问题,提出一种动态三维避障算法。首先对城市低空环境建模并将无人机的动态避障问题表达为马尔可夫决策过程,通过在动作集中加入高度变化等飞行动作,将避障算法可行解...
关键词:无人机 航空安全 避障算法 马尔可夫决策过程 鲁棒性 
基于改进深度确定性策略梯度算法的综合能源系统优化调度策略
《现代电力》2025年第2期322-332,共11页龚锦霞 李琛舟 柯慧 
针对综合能源系统优化调度问题中存在的决策空间庞大、算法难以收敛等问题,提出一种基于改进深度确定性策略梯度算法(deep deterministic policy gradient,DDPG)的优化调度策略。通过增设第二个经验池,解决算法难以收敛,甚至寻优失败的...
关键词:综合能源系统 DDPG算法 马尔可夫决策过程 深度强化学习 
基于强化学习的连续优化综述
《信息化研究》2025年第2期1-8,共8页张峰 
进化算法在过去几十年中是求解连续优化问题的流行方法,进化算法的搜索过程可以被建模为马尔可夫决策过程。随着强化学习的广泛应用,为了能够更好地求解连续优化问题,许多学者尝试将强化学习整合到进化算法的框架中,设计出了各类基于强...
关键词:进化算法 连续优化 马尔可夫决策过程 强化学习 
基于回溯和启发式的全局约束满足扫雷算法
《中央民族大学学报(自然科学版)》2025年第1期80-89,共10页陈琳 陈兴国 闫凡宇 戴芮昊 陈钰浩 
国家自然科学基金(62276142,62206133,62202240,62192783);科技创新2030新一代人工智能重大项目(2018AAA0100905);江苏省初步研究与发展计划(BE2021028);深圳市基础研究计划(2021Szvup056);莆田学院科研项目(2024017)。
扫雷游戏是一款规则简单但复杂度是NP⁃complete的单人小游戏,研究扫雷游戏算法不但是针对算法本身的研究,更是对计算复杂度理论的研究。本文通过马尔可夫决策过程对游戏进行建模,并在规则算法的基础上实现了基于约束满足的二元决策图算...
关键词:人工智能游戏 扫雷游戏 马尔可夫决策过程 二元决策图 约束满足 启发式 
云网融合环境下服务组合的未来属性验证
《计算机工程》2025年第3期310-319,共10页王湛 张鹏程 金惠颖 吉顺慧 
国家自然科学基金(U21B2016,62272145)。
随着云网融合技术以及空天地一体化网络的快速发展,越来越多的服务开始在云网融合环境下运行。在云网融合环境下,用户呈现移动性特征,导致服务组合过程变得愈发复杂,服务组合验证变得尤为关键。同时,在云网融合环境下用户要求服务组合...
关键词:云网融合 服务组合 马尔可夫决策过程 服务质量 形式化验证 
基于序贯检测的快速马尔可夫决策:理论、方法及应用
《信号处理》2025年第3期448-471,共24页陈祖旭 陈巍 李长坤 韩宇星 
国家自然科学基金(62261160390,62471276);深圳市启动经费项目(QD2023014C);美团科研基金。
本文立足存在突变状态与检测噪声复杂环境,针对控制后效性与动作迟滞性问题,探索提升决策与控制时效性的方法,提出了一种基于序贯检测的快速马尔可夫决策框架,并应用于智能电网、疾控、水利等若干典型场景。具体的,本文发掘了统计信号...
关键词:统计信号处理 随机最优控制 序贯检测 最速变化点检测 马尔可夫决策过程 受约束马尔可夫决策过程 
移动边缘计算中融合注意力机制的DRL工作流任务卸载算法
《现代电子技术》2025年第6期45-51,共7页雷雪梅 张贺同 
移动边缘计算的计算密集型任务多为工作流任务,传统方法在解决工作流任务卸载问题时很难充分考虑子任务之间的依赖关系,并且计算卸载算法性能不佳。为了解决以上问题,将工作流任务卸载问题建模为马尔可夫决策过程下的最优策略问题,构建...
关键词:移动边缘计算 注意力机制 工作流任务 任务卸载 深度强化学习 马尔可夫决策过程 系统能耗 
基于Linformer和多关系解码器的异构车队路径规划模型研究
《建模与仿真》2025年第2期142-156,共15页李顺龙 
异构有容量限制的车辆路径规划问题(Heterogeneous Capacitated Vehicle Routing Problem,HCVRP)因其广泛的实际应用和复杂的约束条件,成为现代物流优化中的重要研究课题。然而,现有方法在处理异构车队多目标优化任务时,仍存在计算复杂...
关键词:异构车辆路径规划 深度强化学习 低秩注意力机制 多关系解码器 马尔可夫决策过程 
检索报告 对象比较 聚类工具 使用帮助 返回顶部