云南高校图书馆联盟文献共享服务平台- 安徽省自然科学基金(050420303)

公共卫生与预防医学

营养与食品卫生学

人体解剖和组织胚胎学

航空、航天与航海医学

影像医学与核医学

血液循环系统疾病

神经病学与精神病学

皮肤病学与性病学

微生物与生化药学

农业机械化工程

农业电气化与自动化

作物栽培与耕作技术

农业昆虫与害虫防治

木材科学与技术

特种经济动物饲养

材料科学与工程

矿井通风与安全

石油与天然气工程

油气田开发工程

冶金机械及自动化

金属切削加工及机床

机械设计及理论

机械制造及自动化

仪器科学与技术

精密仪器及机械

测试计量技术及仪器

兵器科学与技术

兵器发射理论与技术

武器系统与运用工程

火炮、自动武器与弹药工程

军事化学与烟火技术

动力工程及工程热物理

动力机械及工程

流体机械及工程

核燃料循环与材料

辐射防护及环境保护

电工理论与新技术

电力系统及自动化

高电压与绝缘技术

电力电子与电力传动

微电子学与固体电子学

信息与通信工程

通信与信息系统

信号与信息处理

自动化与计算机技术

控制科学与工程

控制理论与控制工程

检测技术与自动化装置

计算机科学与技术

计算机系统结构

计算机软件与理论

计算机应用技术

合成树脂塑料工业

轻工技术与工程

纺织科学与工程

纺织材料与纺织品设计

纺织化学与染整工程

服装设计与工程

食品科学与工程

粮食、油脂及植物蛋白工程

农产品加工及贮藏工程

水产品加工及贮藏工程

皮革化学与工程

建筑设计及理论

城市规划与设计

供热、供燃气、通风及空调工程

桥梁与隧道工程

水文学及水资源

水力学及河流动力学

道路与铁道工程

交通信息工程及控制

交通运输规划与管理

载运工具运用工程

船舶与海洋工程

船舶及航道工程

港口、海岸及近海工程

航空宇航科学技术

航空宇航推进理论与工程

航空宇航制造工程

人机与环境工程

环境科学与工程

概率论与数理统计

运筹学与控制论

一般力学与力学基础

热学与物质分子运动论

原子与分子物理

粒子物理与原子核物理

测绘科学与技术

大地测量学与测量工程

摄影测量与遥感

地图制图学与地理信息工程

固体地球物理学

大气科学及气象学

大气物理学与大气环境

古生物学与地层学

职业技术教育学

国际共产主义运动

宪法学与行政法学

环境与资源保护法学

马克思主义哲学

发展与教育心理学

考古学及博物馆学

时间限定

时间：

更新时间：

期刊范围

全部期刊核心期刊 EI来源期刊 SCI来源期刊 CAS来源期刊 CSCD来源期刊 CSSCI来源期刊

学科限定全选

安徽省自然科学基金(050420303): 作品数：6被引量：10H指数：2; 导出分析报告; 相关作者：唐昊周雷吴玉华袁继彬程文娟更多>>; 相关机构：合肥工业大学更多>>; 相关期刊：《控制理论与应用》《系统仿真学报》《控制与决策》《合肥工业大学学报（自然科学版）》更多>>; 相关主题：性能势SMDP半MARKOV决策过程神经元动态规划半马尔可夫决策过程更多>>; 相关领域：自动化与计算机技术更多>>

在结果中检索

检索结果分析

共条记录，以下是1-6

全选清除导出

参考文献引证文献引用追踪

视图：

排序：

基于策略迭代和遗传算法的SMDP鲁棒控制策略求解被引量：1: 《合肥工业大学学报（自然科学版）》2007年第11期1404-1407,共4页程燕唐昊马学森; 国家自然科学基金资助项目(60404009);安徽省自然科学基金资助项目(050420303);合肥工业大学中青年科技创新群体计划资助; 半马尔可夫决策过程(SMDP)描述的一类受控半Markov系统,其模型参数在实际中常常不确定或不可知,可能导致随机过程的性能函数和系统参数(即嵌入链转移概率和状态逗留时间分布)皆不确定。该文针对参数不相关的情况,给出求解鲁棒控制策略...; 关键词：半马尔可夫决策过程性能势鲁棒控制遗传算法

SMDP基于Actor网络的统一NDP方法: 《控制与决策》2007年第2期155-159,共5页唐昊陈栋周雷吴玉华; 国家自然科学基金项目(60404009);安徽省自然科学基金项目(050420303);合肥工业大学中青年科技创新群体计划项目; 研究半马尔可夫决策过程(SMDP)基于性能势学习和策略逼近的神经元动态规划(NDP)方法.通过SMDP的一致马尔可夫链的单个样本轨道,给出了折扣和平均准则下统一的性能势TD(λ)学习算法,进行逼近策略评估;利用一个神经元网络逼近结构作为行动...; 关键词：半MARKOV决策过程性能势 TD(λ)学习神经元动态规划

SMDP基于性能势的M步向前策略迭代: 《吉林大学学报（工学版）》2006年第6期958-962,共5页吴玉华唐昊周雷; 国家自然科学基金项目(60404009);安徽省自然科学基金资助项目(050420303);合肥工业大学中青年科技创新群体计划资助项目; 运用基于性能势的M步向前(look-ahead)异步策略迭代算法研究了半Markov决策过程(SMDP)优化问题。首先给出了基于性能势理论求解的一种M步向前策略迭代算法。该算法不仅对标准策略迭代算法和一般的异步策略迭代算法都适用,而且对SMDP在...; 关键词：计算机应用半MARKOV决策过程性能势 M步向前策略迭代即时差分学习

半Markov决策过程的数值迭代优化被引量：2: 《吉林大学学报（工学版）》2006年第1期108-112,共5页唐昊吴玉华周雷; 国家自然科学基金资助项目(60404009);安徽省自然科学基金资助项目(050420303);合肥工业大学中青年科技创新群体计划项目; 针对半Markov决策过程在紧致行动集上的数值迭代优化,提出了折扣和平均准则下直接基于等价无穷小生成子的统一的标准数值迭代算法,并证明了其收敛性。另外,讨论了两种性能准则下统一的异步数值迭代算法,包括Gauss-Seidel异步迭代和随机...; 关键词：计算机应用半MARKOV决策过程等价无穷小生成子异步数值迭代

平均和折扣准则MDP基于TD(0)学习的统一NDP方法被引量：5: 《控制理论与应用》2006年第2期292-296,共5页唐昊周雷袁继彬; 国家自然科学基金资助项目(60404009);安徽省自然科学基金资助项目(050420303);合肥工业大学中青年科技创新群体计划资助项目; 为适应实际大规模M arkov系统的需要,讨论M arkov决策过程(MDP)基于仿真的学习优化问题.根据定义式,建立性能势在平均和折扣性能准则下统一的即时差分公式,并利用一个神经元网络来表示性能势的估计值,导出参数TD(0)学习公式和算法,进行...; 关键词：MARKOV决策过程性能势 TD(0)学习神经元动态规划

不确定SMDP基于全局优化的鲁棒决策问题被引量：4: 《系统仿真学报》2005年第11期2704-2707,共4页刘春唐昊程文娟; 国家自然科学基金项目(60404009);安徽省自然科学基金项目(050420303);合肥工业大学中青年科技创新群体计划资助; 考虑半马尔可夫决策过程(SMDP)在一些系统参数不确定,且性能函数依赖于这些参数时的鲁棒决策问题。这些参数的不确定性不仅导致等价无穷小生成子的不确定性,也导致性能函数的不确定性。论文针对相关参数的情况,分别采用不同的全局优化算...; 关键词：半马尔可夫决策过程性能势鲁棒决策全局优化

全选清除导出

共1页<1>

检索报告对象比较聚类工具使用帮助返回顶部

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

安徽省自然科学基金(050420303)

检索结果分析

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

安徽省自然科学基金(050420303)

检索结果分析

下载全文

用户登录

高级检索检索式检索