陈冬火

作品数:17被引量:52H指数:4
导出分析报告
供职机构:苏州大学更多>>
发文主题:SPIN机器人时序逻辑形式化方法以太网传输更多>>
发文领域:自动化与计算机技术轻工技术与工程文化科学电子电信更多>>
发文期刊:《计算机教育》《电子学报》《微电子学与计算机》《福建电脑》更多>>
所获基金:江苏省高校自然科学研究项目国家自然科学基金重庆市自然科学基金苏州市科技计划项目(应用基础研究计划)更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
循环迭代程序的一种可信计算算法被引量:2
《软件学报》2020年第12期3685-3699,共15页赵世忠 陈冬火 刘静 
国家重点研发项目(2017YFB1001800);国家自然科学基金(61772203,61972150,61876034)。
循环迭代程序作为软件的基本组成部分,其正确运行具有重要意义.然而,有时(比如其相关错数大于0时)计算时的舍入误差(或表示误差)会导致循环迭代的计算结果不稳定.基于“中间计算精度自动动态调整”的计算技术,给出了循环迭代程序的一种...
关键词:循环迭代 误差可控计算 可信计算 可靠计算 错数 
一种带自适应学习率的综合随机梯度下降Q-学习方法被引量:15
《计算机学报》2019年第10期2203-2215,共13页金海东 刘全 陈冬火 
国家自然科学基金(61772355,61702055,61502323,61502329);江苏省高等学校自然科学研究重大项目(17KJA520004、18KJA520011);吉林大学符号计算与知识工程教育部重点实验室资助项目(93K172014K04,93K172017K18);苏州市应用基础研究计划工业部分(SYG201422);苏州市重点产业技术创新-前瞻性应用研究项目(SYG201804);江苏省高校省级重点实验室(苏州大学)(KJS1524)资助~~
在线强化学习中,值函数的逼近通常采用随机梯度下降(Stochastic Gradient Descent,SGD)方法.在每个时间步,SGD方法使用强化学习算法获取随机样本,计算损失函数的局部梯度,单次模型参数更新的计算量小,适合在线学习.但是,由于目标函数不...
关键词:强化学习 综合随机梯度下降 自适应学习率 参数预测 Q-学习 
一种解决连续空间问题的真实在线自然梯度AC算法被引量:5
《软件学报》2018年第2期267-282,共16页朱斐 朱海军 刘全 陈冬火 伏玉琛 
国家自然科学基金(61303108;61373094;61472262);江苏省高校自然科学研究项目(17KJA520004);符号计算与知识工程教育部重点实验室(吉林大学)资助项目(93K172014K04);苏州市应用基础研究计划工业部分(SYG201422);高校省级重点实验室(苏州大学)项目(KJS1524);中国国家留学基金(201606920013)~~
策略梯度作为一种能够有效解决连续空间决策问题的方法得到了广泛研究,但由于在策略估计过程中存在较大方差,因此,基于策略梯度的方法往往受到样本利用率低、收敛速度慢等限制.针对该问题,在行动者-评论家(actor-critic,简称AC)算法框架...
关键词:策略梯度 自然梯度 行动者-评论家 真实在线TD 核方法 
基于凸多面体抽象域的自适应强化学习技术研究被引量:5
《计算机学报》2018年第1期112-131,共20页陈冬火 刘全 朱斐 金海东 
国家自然科学基金项目(61272005;61303108;61373094;61472262;61502323;61502329);江苏省自然科学基金项目(BK2012616);江苏省高校自然科学研究项目(13KJB520020);吉林大学符号计算与知识工程教育部重点实验室项目(93K172014K04);苏州市应用基础研究计划项目(SYG201422);苏州大学高校省级重点实验室基金项目(KJS1524);中国国家留学基金项目(201606920013);浙江省自然科学基金(LY16F010019)资助~~
表格驱动的算法是解决强化学习问题的一类重要方法,但由于"维数灾"现象的存在,这种方法不能直接应用于解决具有连续状态空间的强化学习问题.解决维数灾问题的方法主要包括两种:状态空间的离散化和函数近似方法.相比函数近似,基于连续状...
关键词:强化学习 凸多面体抽象域 连续状态空间 Q(λ) 自适应精化 
一种不稳定环境下的策略搜索及迁移方法被引量:3
《电子学报》2017年第2期257-266,共10页朱斐 刘全 傅启明 陈冬火 王辉 伏玉琛 
国家自然科学基金(No.61303108;No.61373094;No.61272005;No.61472262;No.61502329);江苏省高校自然科学研究基金(No.13KJB520020);吉林大学符号计算与知识工程教育部重点实验室基金(No.93K172014K04);苏州市应用基础研究计划基金(No.SYG201422);苏州大学高校省级重点实验室基金(No.KJS1524);中国国家留学基金(No.201606920013)
强化学习是一种Agent在与环境交互过程中,通过累计奖赏最大化来寻求最优策略的在线学习方法.由于在不稳定环境中,某一时刻的MDP模型在与Agent交互之后就发生了变化,导致基于稳定MDP模型传统的强化学习方法无法完成不稳定环境下的最优策...
关键词:强化学习 策略搜索 策略迁移 不稳定环境 公式集 
具有程序的静态结构和动态行为语义的时序逻辑
《计算机研究与发展》2016年第9期2067-2084,共18页陈冬火 刘全 金海东 朱斐 王辉 
国家自然科学基金项目(61272005;61303108;61373094;61472262;61502323;61502329);江苏省自然科学基金项目(BK2012616);福建省自然科学基金项目(2014J01221);江苏省高校自然科学研究项目(13KJB520020);吉林大学符号计算与知识工程教育部重点实验室项目(93K172014K04);苏州市应用基础研究计划项目(SYG201422)~~
提出一种区间分支时序逻辑——控制流区间时序逻辑(control flow interval temporal logic,CFITL),用于规约程序的时序属性.不同于计算树逻辑(computation tree logic,CTL)和线性时序逻辑(linear temporal logic,LTL)等传统的时序逻辑,C...
关键词:区间时序逻辑 控制流程图 程序静态结构 模型检验 可满足性模理论 
基于KeY的程序分析和验证被引量:2
《软件》2016年第3期74-78,共5页夏新凯 陈冬火 
可信性是各安全攸关领域软件的基础要求,例如航空航天飞行器控制软件、核电站控制软件和交通控制管理软件等,基于形式化方法的程序验证和分析是确保软件正确,具有可信性的重要手段。相比软件测试,基于定理证明的程序验证具有语法和语义...
关键词:程序验证 KeY系统 安全攸关 循环不变式 
基于函数近似的知识迁移被引量:2
《软件》2016年第2期134-138,共5页谢岩松 金海东 陈冬火 
传统强化学习中,函数近似方法用于同一任务中不同状态之间的知识泛化。提出基于函数近似的知识迁移方法 KTBFA,实现不同任务之间的知识泛化与迁移。KTBFA方法在对状态-动作空间进行特征编码的基础上,使用线性函数逼近器近似表示Agent在...
关键词:知识迁移 强化学习 相似任务 V值 
基于递归的方法在形式文法教学中的作用
《福建电脑》2014年第12期160-162,共3页陈冬火 
形式化文法是编译理论及程序语言理论重要的研究内容之一,同时也是编译原理课程本科教学中的基础内容。掌握系统化形式化文法分析方法是学生学习编译原理基础理论,自动及非自动构造各种编译器的重要基础。通过递归,各种类型复杂度的程...
关键词:编译原理 形式文法 递归 语言 
基于符号执行和LTL公式重写的测试用例产生方法被引量:3
《计算机研究与发展》2013年第12期2661-2675,共15页陈冬火 刘全 
国家自然科学基金项目(61070223;61103045;61070122;61272005;61303108);江苏省自然科学基金项目(BK2012616)
基于模型检验等形式化方法的测试用例自动产生技术成为测试自动化领域一项重要的进展.对于输入和输出为无界抽象数据类型的无限状态系统,利用传统模型检验技术难以有效地产生测试用例集合,提出基于符号执行和公式重写的测试用例产生方法...
关键词:测试用例自动产生 符号执行 公式重写 模型检验 线性时序逻辑 输入 输出符号变迁系统 
检索报告 对象比较 聚类工具 使用帮助 返回顶部