吴沧浦

作品数:63被引量:159H指数:5
导出分析报告
供职机构:北京理工大学更多>>
发文主题:神经网络动态规划最优控制递阶控制轧机更多>>
发文领域:自动化与计算机技术理学社会学经济管理更多>>
发文期刊:《计算机工程与设计》《控制理论与应用》《Journal of Beijing Institute of Technology》《计算机工程与应用》更多>>
所获基金:国家自然科学基金国防科技技术预先研究基金国家教育部博士点基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
一种基于状态聚类的SARSA(λ)强化学习算法被引量:3
《计算机工程》2003年第5期37-38,98,共3页李春贵 吴沧浦 刘永信 
为求解大状态空间的强化学习问题,提出了一种基于状态聚类的SARSA(λ)强化学习算法,其基本思想是利用先验知识或事先训练控制器,对状态空间进行聚类,分为不同的簇,然后在簇空间上进行SARSA(λ)学习。若能进行适当的状态聚类,算法...
关键词:SARSA(λ)强化学习算法 状态聚类 强化学习 函数近似 SARSA学习 人工神经网络 
基于Web的决策支持系统界面开发的一种面向对象框架被引量:1
《计算机工程与设计》2002年第11期59-62,共4页黄健昌 吴沧浦 
国家自然科学基金资助项目(696740005)
随着Internet/Intranet在现代企业中的广泛应用,基于Internet/Intranet的决策支持系统已成为一个亟待研究的新领域。许多学者已经对如何把面向对象的编程思想运用到模型管理系统和数据库管理系统中作了大量的研究,但对于界面开发方面的...
关键词:WEB 决策支持系统 界面开发 面向对象框架 用户界面 INTERNET INTRANET 
一种基于Intranet和多Agent系统的决策支持系统框架
《计算机工程与应用》2002年第19期233-235,共3页黄健昌 吴沧浦 
基于Intranet的决策支持系统的研究不仅具有重大的理论价值,而且具有很高的应用价值。该文通过对多A-gent系统与传统决策支持系统的比较和结合,把Agent方法引入到基于Intranet的决策支持系统的研究中,提出了一种新型的决策支持系统实现...
关键词:INTRANET 多AGENT系统 决策支持系统 框架 
一种集成规划的SARSA(λ)强化学习算法被引量:2
《北京理工大学学报》2002年第3期325-327,共3页李春贵 吴沧浦 刘永信 
国家自然科学基金资助项目 (696740 0 5 )
提出一种新的集成规划的 SARSA(λ)强化学习算法 .该算法的主要思想是充分利用已有的经验数据 ,在无模型学习的同时估计系统模型 ,每进行一次无模型学习的试验后 ,利用模型在所记忆的状态 /行动对组成的表中进行规划 ,同时利用该表给出...
关键词:强化学习 MARKOV决策过程 SARSA学习 规划 
一种快速的单层感知器网络学习算法被引量:3
《计算机工程》2001年第12期43-45,共3页易中凯 吴沧浦 
高校博士专项科研基金项目(B-122)
提出了一种单层感知器网络训练的新算法。证明了对于线性可分问题和线性不可分问题,算法总是在有限步内终止,算法的迭代次数以模式数为上界;而且,在算法终止时,对于线性可分问题,总是能得到正确的权向量解,所以,如果在算法结束时还不能...
关键词:单层感知器网络 增广型模式向量 增广型权值向量 学习算法 神经网络 模式识别 
一种使用RBF网络辨识不定性上界的滑模控制器被引量:3
《控制与决策》2001年第4期507-509,共3页刘英敏 吴沧浦 
研究使用 RBF网络辨识满足匹配条件外干扰的未知上界 ,设计控制系统的滑模控制器问题。基于 L yapunov稳定性理论更新 RBF网络的参数 ,证明了闭环系统的全局渐近稳定性。仿真结果表明了设计方法的有效性。
关键词:滑模控制器 RBF网络 匹配条件 不定性 稳定性 
一种用于多类模式识别的综合感知器网络和学习算法
《北京理工大学学报》2001年第4期459-463,共5页易中凯 吴沧浦 
高等学校博士学科点专项科研基金资助课题 ( B-1 2 2 )
提出一种由感知器神经元组合成的综合网络模型及相应的学习算法 .网络由 3层感知器神经元组成 ,中间层到输出层的权值相应地为 +1或 - 1.输入层到中间层的权值通过学习获得 ,且中间层每个神经元的权值单独学习完成 .该学习算法在有限次...
关键词:感知器神经元 综合网络模型 多类模式识别 增广型模式向量 增广型权向量 学习算法 
前向多层感知器网络的逐层学习算法被引量:1
《北京理工大学学报》2001年第4期464-468,共5页易中凯 吴沧浦 
高等学校博士学科点专项科研基金资助课题 ( B -1 2 2 )
提出一种改进的前向多层网络逐层学习算法 .隐层神经元的输出函数由具体系统的样本输出值确定 .先让前面的隐层及输入层的权值确定不变 ,然后对当前层的权值进行调节 ,对前一隐层输出值的误差进行估计以得到新的输出值 ,将其作为临时教...
关键词:前向多层网络 逐层学习算法 误差估计 临时教师信号 隐层神经元 输出函数 
一种基于Intranet的模型管理系统及其实现被引量:5
《北京理工大学学报》2001年第2期210-214,共5页黄健昌 吴沧浦 
国家自然科学基金资助项目!(6 96 740 0 0 5 )
对当前基于 Intranet模型管理系统的国内外研究成果进行综合评价和改进 .在此基础之上 ,给出了一种基于 Intranet的模型管理系统框架 ,并运用先进的计算机开发技术 ,给出了实现方法 .该模型管理系统充分利用了 Intranet技术的特点和优...
关键词:模型管理系统 模型库 万维网 JAVA INTRNET DSS 
使用最小二乘法减少神经网络的隐单元被引量:4
《北京理工大学学报》2000年第6期693-697,共5页刘英敏 吴沧浦 毕大川 
国家自然科学基金资助项目! ( 69674 0 0 5)
提出新的逐步减少神经元个数并保持神经网络性能的方法 .每一步中利用提出的规则之一选择被消去的单元 ,然后求解一个线性最小二乘问题调整网络中部分剩余权值 ,使简化网络的输入 -输出关系在训练集上尽量保持不变 .该方法可以得到比已...
关键词:神经网络 最小二乘法 隐单元 修剪算法 泛化能力 
检索报告 对象比较 聚类工具 使用帮助 返回顶部