MARKOV控制过程

作品数:7被引量:22H指数:3
导出分析报告
相关领域:自动化与计算机技术理学更多>>
相关作者:奚宏生殷保群唐昊周亚平江琦更多>>
相关机构:中国科学技术大学合肥工业大学更多>>
相关期刊:《控制理论与应用》《控制与决策》《自动化学报》《中国科学技术大学学报》更多>>
相关基金:国家自然科学基金安徽省自然科学基金国际科技合作与交流专项项目更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-7
视图:
排序:
智能电网弹性响应时间业务需求的接入控制被引量:7
《控制与决策》2014年第7期1311-1315,共5页江琦 路改香 唐昊 谭琦 
国家自然科学基金项目(61374158;61233003;61174186;61074033);国家国际科技合作项目(2011DFA10440);安徽省自然科学基金项目(11040606M142)
考虑智能电网多种类型业务需求的接入控制,通过利用响应时间的弹性来平缓业务负荷的波动,使得电网运行的长期平均代价最小.针对业务需求和用户行为的随机分布特性,建立连续时间Markov控制过程的系统分析模型;结合性能势基于样本轨道的估...
关键词:智能电网 需求负荷控制 MARKOV控制过程 策略迭代 接入控制 
基于性能势的Markov控制过程双时间尺度仿真算法
《系统仿真学报》2009年第13期4114-4119,共6页鲍秉坤 殷保群 奚宏生 
国家自然科学基金(60574065;60774038)
在基于性能势的随机逼近方法中引入双时间尺度的概念,提出了离散时间Markov控制过程的基于性能势的双时间尺度仿真梯度算法,弥补了传统算法中每步更新算法更新频率过快和更新环更新算法更新频率过慢的不足,并利用三个数值例子来说明双...
关键词:MARKOV控制过程 性能势 双时间尺度 随机逼近 
Markov控制过程基于性能势仿真的并行优化被引量:1
《系统仿真学报》2003年第11期1574-1576,共3页高旭东 殷保群 唐昊 奚宏生 
国家自然科学基金(69974037);安徽省自然科学基金(01042308)
Markov控制过程是研究随机离散事件动态系统性能优化问题的一个重要模型,并在许多实际工程问题中有着广泛的应用。在Markov性能势理论的基础上,我们讨论了一类连续时间Markov控制过程在紧致行动集上的性能优化仿真问题。由于实际系统的...
关键词:性能势 并行仿真算法 连续时间Markov控制过程 紧致行动集 
Markov控制过程在紧致行动集上的迭代优化算法被引量:5
《控制与决策》2003年第3期267-271,共5页唐昊 奚宏生 殷保群 
国家自然科学基金资助项目 ( 699740 3 7);国家高性能计算基金资助项目 ( 0 0 2 0 8)
研究一类连续时间 Markov控制过程 ( CTMCP)在紧致行动集上关于平均代价性能准则的优化算法。根据 CTMCP的性能势公式和平均代价最优性方程 ,导出了求解最优或次最优平稳控制策略的策略迭代算法和数值迭代算法 ,在无需假设迭代算子是 sp...
关键词:MARKOV控制过程 紧致行动集 性能势 策略迭代 数值迭代 
Markov控制过程基于性能势的平均代价最优策略被引量:4
《自动化学报》2002年第6期904-910,共7页周亚平 奚宏生 殷保群 孙德敏 
国家自然科学基金 ( 6 9974 0 37);国家高性能计算基金 ( 0 0 2 12 )资助
研究了一类离散时间 Markov控制过程平均代价性能最优控制决策问题 .应用Markov性能势的基本性质 ,在很一般性的假设条件下 ,直接导出了无限时间平均代价模型在紧致行动集上的最优性方程及其解的存在性定理 .提出了求解最优平稳控制策...
关键词:MARKOV控制过程 性能势 平均代价模型 最优平稳策略 最优控制 
Markov控制过程基于单个样本轨道的在线优化算法被引量:5
《控制理论与应用》2002年第6期865-871,共7页唐昊 奚宏生 殷保群 
国家自然科学基金 (699740 3 7);国家高性能计算基金 (0 0 2 0 8)资助项目
在Markov性能势理论基础上 ,研究了Markov控制过程的性能优化算法 .不同于传统的基于计算的方法 ,文中的算法是根据单个样本轨道的仿真来估计性能指标关于策略参数的梯度 ,以寻找最优 (或次优 )随机平稳策略 .由于可根据不同实际系统的...
关键词:MARKOV控制过程 单个样本轨道 在线优化算法 离散事件动态系统 随机平稳策略 
Markov控制过程基于神经元动态规划的优化算法被引量:1
《中国科学技术大学学报》2001年第5期549-557,共9页唐昊 奚宏生 殷保群 
国家自然科学基金 (6 99740 37);国家高性能计算基金 (0 0 2 0 8)资助项目
论文在Markov性能势理论基础上 ,研究了Markov控制过程在神经元网络等逼近结构表示的随机平稳策略作用下的仿真优化算法 ;分析了它们在一个无限长的样本轨道上以概率 1的收敛性 ;并给出了一个三
关键词:Markov性能势理论 MARKOV控制过程 随机平稳策略 样本轨道 神经元动态规划 随机决策问题 
检索报告 对象比较 聚类工具 使用帮助 返回顶部