马氏决策过程

作品数:52被引量:125H指数:6
导出分析报告
相关领域:理学更多>>
相关作者:胡奇英郭先平章宗长魏轶华刘建庸更多>>
相关机构:中山大学清华大学西安电子科技大学暨南大学更多>>
相关期刊:《西北师范大学学报(自然科学版)》《系统工程理论与实践》《西安电子科技大学学报》《云南大学学报(自然科学版)》更多>>
相关基金:国家自然科学基金湖南省自然科学基金广东省自然科学基金中国博士后科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
风险概率准则下的非平稳马氏决策过程
《应用概率统计》2023年第4期589-603,共15页温馨 徐小雅 郭先平 
The research was supported by the National Natural Science Foundation of China(Grant Nos.11931018,72101059);Guangdong Natural Science Foundation(Grant No.2020A1515010924).
本文研究一类非平稳离散马氏决策过程的风险概率最小化问题,其中转移概率和奖励函数随时间变化.与现有文献中的期望报酬/成本准则不同,本文考虑最小化系统在首次到达某个目标集之前获得的总报酬未能达到给定利润目标的概率.在合理的假...
关键词:非平稳离散马氏决策过程 风险概率准则 最优方程序列 首达时间 最优马氏策略 
风险敏感马氏决策过程与状态扩充变换
《中山大学学报(自然科学版)(中英文)》2023年第1期181-191,共11页马帅 夏俐 
国家自然科学基金(62073346,U1811462)。
在马氏决策过程中,过程的随机性由策略与转移核决定,优化目标的随机性受随机报酬与随机策略的影响,其中随机报酬往往可通过简化转化为确定型报酬。当优化准则为经典的期望类准则,如平均准则或折扣准则时,报酬函数的简化不会影响优化结...
关键词:马氏决策过程 状态扩充变换 风险 报酬函数简化 
基于大数据的涉警网络舆情多阶段干预决策建模研究
《数学的实践与认识》2023年第2期98-110,共13页宋全喜 刘克 寻其锋 
在大数据爆炸的时代,网络舆情、尤其是负面网络舆情管理,已成为管理层面临的难题和亟需解决的决策问题.基于目前涉警网络舆情事件研究更多偏向于定性研究,应用大数据和动态优化理论,从历史事件中寻找舆情演变规律,创新性的提出从负面评...
关键词:涉警网络舆情 大数据 马氏决策过程 动态优化 干预策略 
可变折扣马氏决策过程首达模型列的收敛问题
《应用概率统计》2021年第6期598-610,共13页吴晓 郭圳滨 
国家自然科学基金项目(批准号:11961005);广东省普通高校特色创新类项目基金(批准号:2018KTSCX253)资助.
本文主要研究了可数状态空间上带多约束、可变折扣马氏决策过程首达模型序列的收敛问题.利用``占有测度''及其相关性质,将受约束首达模型序列的优化问题转化为等价的受约束线性规划问题(凸分析方法),在合适条件下证明了首达模型序列的...
关键词:马氏决策过程首达模型 多约束 依赖状态折扣因子 凸分析方法 收敛问题 
可数状态空间的平均成本马氏决策过程
《控制理论与应用》2021年第11期1707-1716,共10页张俊玉 吴怡婷 夏俐 曹希仁 
Supported by the National Natural Science Foundation of China(61673019,61773411,11931018,62073346);the Guangdong Province Key Laboratory of Computational Science at the Sun Yat-sen University(2020B1212060032);the Guangdong Basic and Applied Basic Research Foundation(2021A1515010057,2021A1515011984)。
具有可数状态空间的马尔可夫决策过程(Markov decision process,MDP)在平均准则下,最优(平稳)策略不一定存在.本文研究平均准则可数状态MDP中满足最优不等式的最优策略.不同于消去折扣(因子)方法,利用离散的Dynkin公式推导本文的主要结...
关键词:马尔可夫决策过程 平均准则 可数状态空间 Dynkin公式 泊松方程 性能敏感 
随机环境下连续时间马氏决策过程最优控制存在性
《应用概率统计》2021年第4期421-440,共20页邵井海 赵坤 
本文研究随机环境对于连续时间马氏决策过程最优控制问题的影响,给出有限水平最优控制存在的判别条件,将研究扩散过程最优控制问题常用的紧致化方法推广到对连续时间马氏决策过程的研究.
关键词:马氏决策过程 有限水平准则 带切换的扩散过程 松弛控制 随机策略 
马氏决策过程在股票预测中的应用
《投资与创业》2021年第9期1-3,共3页吴晓 唐艳秋 
国家自然科学基金“基于逐段决定马氏决策过程风险概率准则的优化问题研究”(11961005);广东省普通高校特色创新类项目“可变折扣Markov控制过程的随机优化”(2018KTSCX253)
本文应用马氏决策过程(Markov Decision Processes,MDP)理论,对系统由一个状态转移到另一个状态的变化作出了定量分析,运用随机过程得出概率转移矩阵、报酬矩阵,并进行概率转移矩阵的马氏性检验。通过具体实例进行马氏决策模型的验证,...
关键词:马氏决策过程 概率转移矩阵 报酬矩阵 预测 随机过程 
共生换代背景下面向策略型消费者的联合策略被引量:6
《系统工程》2020年第2期69-78,共10页郑江波 甘燕红 
广东省自然基金面上项目(2016ZC0052)。
考虑某厂商面向策略型消费者且采用共生换代策略时的联合定价和定量决策问题,把每个周期分为正常销售阶段和折价销售阶段,分别构建单周期博弈模型和多周期马氏决策模型来探讨厂商最优策略与消费者策略行为间的相互影响。研究发现:当市...
关键词:策略型消费者 共生换代 联合策略 马氏决策过程 
采用马氏决策过程和后验克拉美罗下界的多被动式移动传感器长期调度方法被引量:1
《西安交通大学学报》2019年第6期125-133,150,共10页徐公国 单甘霖 段修生 
“十三五”装备预研国防科技重点实验室基金资助项目(012015012600A2203)
针对多被动式移动传感器协同工作时跟踪精度不稳定等问题,提出了一种基于多步预测的移动传感器长期调度方法。该方法结合部分可观马尔科夫决策过程(POMDP)构建多传感器调度模型,并基于后验克拉美罗下界(PCRLB)建立了传感器调度过程中的...
关键词:移动传感器 传感器调度 部分可观马尔科夫决策过程 后验克拉美罗下界 决策树 
历史相依决策模型的建立及相应过程的构造被引量:1
《湖南师范大学自然科学学报》2017年第5期88-94,共7页莫晓云 周杰明 金芳 
国家自然科学基金资助项目(11671132;11601147;11626094);湖南省哲学社会科学研究资助项目(16YBA053);湖南省教育厅重点科研资助项目(15A032);湖南省教育厅科研资助项目(16C0953;16C0296);湖南省自然科学基金资助项目(2017JJ3206)
历史相依决策模型(HDDM)及历史相依决策过程(HDDP)是决策模型及相应的决策过程的一般情形.马氏决策模型(MDM)及马氏决策过程(MDP)是HDDM及HDDP的特殊情形.本文严格地建立了历史相依决策模型,并证明了相应的历史相依决策过程的存在性,证...
关键词:历史相依决策模型的建立 历史相依决策过程的存在性和构造 马氏决策模型及马氏决策过程 马氏过程 
检索报告 对象比较 聚类工具 使用帮助 返回顶部