半MARKOV决策过程

作品数:13被引量:22H指数:2
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:唐昊周雷李衍杰吴玉华陈栋更多>>
相关机构:合肥工业大学哈尔滨工业大学中国科学技术大学国防科学技术大学更多>>
相关期刊:《控制与决策》《华南师范大学学报(自然科学版)》《计算机集成制造系统》《计算机学报》更多>>
相关基金:国家自然科学基金安徽省自然科学基金教育部“新世纪优秀人才支持计划”国家教育部博士点基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
考虑个体差异的系统退化建模与半Markov过程维修决策被引量:3
《计算机集成制造系统》2020年第2期331-339,共9页李琦 李婧 蒋增强 边靖媛 
北京市自然科学基金资助项目(9184030);中央高校基本科研业务费专项资金资助项目(2019JBM053)~~
为了在采样不完全、个体差异明显的条件下对缓慢退化系统的维修策略进行研究,针对具有个体差异的缓慢退化系统,选择线性混合效应模型进行退化建模,并利用自回归方法对模型残差中的时间序列相关性进行调节,提高了模型的准确性。在此基础...
关键词:半MARKOV决策过程 缓慢退化系统 线性混合效应模型 策略迭代算法 
动态电源管理的在线优化技术被引量:2
《控制理论与应用》2018年第1期65-70,共6页翟剑锋 李衍杰 陈浩耀 
国家自然科学基金项目(61004036);深圳市基础计划项目(JCYJ20150731105106111)资助~~
研究离散事件动态系统中的一类随机离散动态系统—–半Markov决策过程,在动态电源管理问题中的应用.动态电源管理问题存在于很多便携式电子设备中,其主要目的是根据电子设备的状态通过电源管理策略选择关闭或休眠一些元器件,从而实现节...
关键词:动态电源管理 智能节能 半MARKOV决策过程 在线优化 
半Markov决策过程的研究进展
《中国科学:数学》2015年第5期477-496,共20页郭先平 黄永辉 
国家自然科学基金(批准号:11471341和61374067)资助项目
本文综述半Markov决策过程(SMDP)理论的发展现状,主要介绍SMDP无限阶段期望折扣报酬准则、长期平均准则、有限阶段期望报酬准则、首达目标期望报酬准则、概率准则、受约束问题和均值-方差准则的研究工作,着重阐述这些优化准则的背景、...
关键词:半MARKOV决策过程 优化准则 最优方程 最优策略 计算方法 
基于连续时间半马尔可夫决策过程的Option算法被引量:2
《计算机学报》2014年第9期2027-2037,共11页唐昊 张晓艳 韩江洪 周雷 
国家自然科学基金(61174188,71231004,61374158);国家国际科技合作项目(2011FA10440);教育部新世纪优秀人才计划项目(NCET-11-0626);高等学校博士学科点专项科研基金(博导类)(20130111110007)资助~~
针对大规模或复杂的随机动态规划系统,可利用其分层结构特点或引入分层控制方式,借助分层强化学习(Hierarchical Reinforcement Learning,HRL)来解决其"维数灾"和"建模难"问题.HRL归属于样本数据驱动优化方法,通过空间/时间抽象机制,可...
关键词:连续时间半Markov决策过程 分层强化学习 Q学习 
非平稳服务请求下的功耗管理
《光学精密工程》2014年第7期1929-1937,共9页马喜强 宋喜佳 刘维亚 郑喜凤 
国家科技支撑计划资助项目(No.2009BAE73B01)
针对嵌入式系统的多任务环境,提出了混合模型功耗管理算法,用于对服从一般分布的系统进行建模。首先,介绍了现有的动态功耗管理策略算法,阐述了算法需要改进的原因。然后,使用重标极差法(Rescaled Range Analysis,R/S)对非平稳服务请求...
关键词:功耗管理 重标极差法 半MARKOV决策过程 策略优化 嵌入式系统 
基于半Markov决策过程的概率布尔网络模型
《华南师范大学学报(自然科学版)》2013年第4期12-15,共4页刘秋丽 杨洁 
国家自然科学基金项目(11226248);高等学校博士学科点专项科研基金项目(20114407120009);广东省高校优秀青年创新人才培养计划资助项目(LYM11047);北京市教委科技面上项目(KM201311232021)
借助半Markov决策过程理论研究了概率布尔网络中的最优控制问题.将概率布尔网络的控制模型转化为首达目标的半Markov决策过程模型,通过选取最优控制输入使得和系统相关的目标函数最小,从而解决了一个最优控制问题,并举例说明所用方法的...
关键词:概率布尔网络 半MARKOV决策过程 风险概率 
一阶非线性随机系统的学习优化控制被引量:2
《合肥工业大学学报(自然科学版)》2010年第5期679-682,共4页岳峰 
安徽省自然科学基金资助项目(070416242;090412046);安徽省高校省级自然科学研究重点资助项目(KJ2007A063)
文章研究了一阶连续时间非线性随机系统的优化控制问题,通过勒贝格采样方法将其建模为半Markov决策过程,采用基于事件驱动和Q学习方法,给出了折扣和平均优化准则下统一的优化算法;仿真实验表明,该算法处理一阶非线性随机系统的最优控制...
关键词:随机系统 半MARKOV决策过程 事件驱动思想 Q学习 
基于半Markov决策过程的劣化系统检测与维修优化模型被引量:10
《自动化学报》2007年第10期1101-1104,共4页程志君 郭波 
国家自然科学基金(70501031)资助~~
针对系统劣化阶段持续时间、检测间隔时间和维修时间都服从一般分布的情况,提出了一类基于半马氏决策过程的劣化系统检测与维修优化模型.利用位相型分布近似一般分布简化了求解过程,并提出了相应的改进值迭代算法.最后通过算例验证了模...
关键词:劣化系统 半马氏决策过程 位相型分布 检测与维修 
SMDP基于Actor网络的统一NDP方法
《控制与决策》2007年第2期155-159,共5页唐昊 陈栋 周雷 吴玉华 
国家自然科学基金项目(60404009);安徽省自然科学基金项目(050420303);合肥工业大学中青年科技创新群体计划项目
研究半马尔可夫决策过程(SMDP)基于性能势学习和策略逼近的神经元动态规划(NDP)方法.通过SMDP的一致马尔可夫链的单个样本轨道,给出了折扣和平均准则下统一的性能势TD(λ)学习算法,进行逼近策略评估;利用一个神经元网络逼近结构作为行动...
关键词:半MARKOV决策过程 性能势 TD(λ)学习 神经元动态规划 
SMDP基于性能势的M步向前策略迭代
《吉林大学学报(工学版)》2006年第6期958-962,共5页吴玉华 唐昊 周雷 
国家自然科学基金项目(60404009);安徽省自然科学基金资助项目(050420303);合肥工业大学中青年科技创新群体计划资助项目
运用基于性能势的M步向前(look-ahead)异步策略迭代算法研究了半Markov决策过程(SMDP)优化问题。首先给出了基于性能势理论求解的一种M步向前策略迭代算法。该算法不仅对标准策略迭代算法和一般的异步策略迭代算法都适用,而且对SMDP在...
关键词:计算机应用 半MARKOV决策过程 性能势 M步向前策略迭代 即时差分学习 
检索报告 对象比较 聚类工具 使用帮助 返回顶部