国家自然科学基金(60404009)

作品数:17被引量:162H指数:4
导出分析报告
相关作者:唐昊周雷韩江洪程文娟吴玉华更多>>
相关机构:合肥工业大学教育部安徽财经大学更多>>
相关期刊:《控制理论与应用》《华南理工大学学报(自然科学版)》《控制与决策》《计算机应用研究》更多>>
相关主题:性能势SMDPMARKOV决策过程神经元动态规划MDP更多>>
相关领域:自动化与计算机技术更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
半Markov可信工业控制以太网研究被引量:3
《计算机应用研究》2010年第3期1047-1051,共5页周森鑫 韩江洪 唐昊 
国家自然科学基金资助项目(60404009);2009年安徽省高校自然科学基金重大项目(ZD200905)
以可信计算和可信网络理论为基础,针对工业控制网络的特点构建可信工业控制网络理论架构。重点研究工业控制网络的安全性、可生存性和可控性等重要属性。以半马尔可夫网络流量模型为基础,建立半马尔可夫可信工业控制网络模型,定量分析...
关键词:可信控制网络 以太网 半马尔可夫 可生存性 可控性 
一种MDP基于性能势的并行Q学习算法
《系统仿真学报》2009年第9期2670-2674,2678,共6页程文娟 唐昊 李豹 周雷 
国家自然科学基金项目(60404009);安徽省自然科学基金项目(070416242;090412046);安徽高校省级自然科学研究重点项目(KJ2007A063)
在性能势理论框架内,研究折扣和平均准则马尔可夫决策过程(MDP)的统一并行Q学习算法。提出了独立并行Q学习算法和状态划分并行Q学习算法,重点讨论了算法中的关键参数的设计,即同步点如何选择的同步策略和如何合成Q因子的Q值构建策略,给...
关键词:Q学习 马尔可夫决策过程 性能势 并行算法 
搬运系统作业分配问题的小脑模型关节控制器Q学习算法被引量:3
《控制理论与应用》2009年第8期884-888,共5页唐昊 丁丽洁 程文娟 周雷 
国家自然科学基金资助项目(60404009);安徽省自然科学基金资助项目(090412046;070416242);安徽高校省级自然科学研究重点资助项目(KJ2007A063;KJ2008A058);教育部留学回国人员科研启动基金资助项目
研究两机器人高速搬运系统的作业分配问题.在系统的Markov决策过程(MDP)模型中,状态变量具有连续取值和离散取值的混杂性,状态空间复杂且存在"维数灾"问题,传统的数值优化难以进行.根据小脑模型关节控制器(CMAC)具有收敛速度快和适应性...
关键词:作业分配 MARKOV决策过程 Q学习 CMAC 
多链MDP的鲁棒控制策略求解
《系统仿真学报》2008年第24期6754-6758,共5页周雷 唐昊 程燕 
国家自然科学基金项目(60404009);安徽省自然科学基金项目(070416242);安徽高校省级自然科学研究重点项目(KJ2007A063)
马尔可夫决策过程(MDP)的许多优化算法一般依赖系统的转移速率,而系统参数的不确定性使得MDP的转移速率往往很难精确得知。针对一类不确定多链MDP模型,基于性能势对参数不相关和相关两种情况下的鲁棒控制问题进行了探讨,并分别给出求解...
关键词:多链MDP 性能势 鲁棒控制 并行遗传算法 
入侵攻击的防火墙无关性研究被引量:1
《计算机应用研究》2008年第5期1521-1523,共3页邓林 余刘琅 王军 韩江洪 
国家自然科学基金资助项目(60404009)
分析研究了入侵攻击的防火墙无关性因素,对安全防护策略的制订提供了方向性的指导,并将不可预知的风险因素转换为一定的可预见性因素,从而提供安全部署策略性的参考方案。
关键词:入侵风险 防火墙无关性 安全策略 攻击模型 统一威胁管理 
Rollout及其并行求解算法在多类商品库存控制中的应用被引量:1
《系统仿真学报》2007年第17期3883-3887,共5页李豹 程文娟 周雷 唐昊 
国家自然科学基金项目(60404009);安徽省自然科学基金项目(050420303;070416242);安徽高校自然科学研究重点项目(KJ2007A063)
Rollout算法是Bertsekas提出的求解马尔科夫决策过程(MDP)问题的一种仿真优化算法。文章研究Rollout算法求解多类商品库存控制问题,给出了基于性能势和神经元动态规划的Rollout优化算法。另外,为了降低运算时间,文章提出了两种Rollout...
关键词:ROLLOUT算法 库存控制 MARKOV决策过程 性能势 并行算法 神经元动态规划 
基于策略迭代和遗传算法的SMDP鲁棒控制策略求解被引量:1
《合肥工业大学学报(自然科学版)》2007年第11期1404-1407,共4页程燕 唐昊 马学森 
国家自然科学基金资助项目(60404009);安徽省自然科学基金资助项目(050420303);合肥工业大学中青年科技创新群体计划资助
半马尔可夫决策过程(SMDP)描述的一类受控半Markov系统,其模型参数在实际中常常不确定或不可知,可能导致随机过程的性能函数和系统参数(即嵌入链转移概率和状态逗留时间分布)皆不确定。该文针对参数不相关的情况,给出求解鲁棒控制策略...
关键词:半马尔可夫决策过程 性能势 鲁棒控制 遗传算法 
网络速率控制的博弈模型被引量:1
《华南理工大学学报(自然科学版)》2007年第9期85-89,共5页钟伯成 韩江洪 
国家自然科学基金资助项目(60404009);教育部博士点基金资助项目(20050359004);安徽省教育厅自然科学基金资助项目(2006KJ087B)
传统的网络速率控制方案需要端系统用户合作以达到最优的网络性能.但是,当存在不合作端系统用户时,这些方案不可避免地会出现拥塞崩溃.为此,提出了一种非合作博弈网络速率控制框架,该方案基于非合作博弈论的Nash解的思想,博弈的各用户...
关键词:博弈论 NASH均衡 定价 网络 速率控制 带宽分配 
SMDP基于Actor网络的统一NDP方法
《控制与决策》2007年第2期155-159,共5页唐昊 陈栋 周雷 吴玉华 
国家自然科学基金项目(60404009);安徽省自然科学基金项目(050420303);合肥工业大学中青年科技创新群体计划项目
研究半马尔可夫决策过程(SMDP)基于性能势学习和策略逼近的神经元动态规划(NDP)方法.通过SMDP的一致马尔可夫链的单个样本轨道,给出了折扣和平均准则下统一的性能势TD(λ)学习算法,进行逼近策略评估;利用一个神经元网络逼近结构作为行动...
关键词:半MARKOV决策过程 性能势 TD(λ)学习 神经元动态规划 
SMDP基于性能势的M步向前策略迭代
《吉林大学学报(工学版)》2006年第6期958-962,共5页吴玉华 唐昊 周雷 
国家自然科学基金项目(60404009);安徽省自然科学基金资助项目(050420303);合肥工业大学中青年科技创新群体计划资助项目
运用基于性能势的M步向前(look-ahead)异步策略迭代算法研究了半Markov决策过程(SMDP)优化问题。首先给出了基于性能势理论求解的一种M步向前策略迭代算法。该算法不仅对标准策略迭代算法和一般的异步策略迭代算法都适用,而且对SMDP在...
关键词:计算机应用 半MARKOV决策过程 性能势 M步向前策略迭代 即时差分学习 
检索报告 对象比较 聚类工具 使用帮助 返回顶部