刘博

作品数:2被引量:1H指数:1
导出分析报告
供职机构:中国矿业大学信息与电气工程学院更多>>
发文主题:Q值知识迁移高斯函数分析模型数据流更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《控制与决策》更多>>
所获基金:中国博士后科学基金教育部“新世纪优秀人才支持计划”国家教育部博士点基金江苏省自然科学基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-2
视图:
排序:
基于径向基统计网络的数据流分析模型
《控制与决策》2010年第6期879-883,888,共6页程玉虎 刘博 王雪松 
国家自然科学基金项目(60804022;60974050);教育部新世纪优秀人才支持计划项目(NCET-08-0836);教育部博士点基金项目(20070290537;200802901506);中国博士后科学基金特别项目(200902533);江苏省自然科学基金项目(BK2008126)
在传统径向基函数网络的基础上,提出一种用于数据流分析的径向基统计网络,采用复合多维高斯函数来拟合输入空间中不同区域的概率密度.基于数理统计方法的径向基统计网络学习算法的时间和空间复杂度,均与输入变量维数和隐层节点个数的乘...
关键词:数据流 径向基统计网络 回归估计 数理统计 高斯函数 
异质Agent间的知识迁移强化学习被引量:1
《中国科技论文在线》2010年第2期120-123,共4页刘博 雷汝海 
针对现有知识迁移方法仅适用于同质强化学习Agent的问题,提出一种能够在具有不同状态动作空间的异质Agent间迁移知识的Q学习算法。该算法的主要思想是通过新旧Agent共同学习过的任务,利用神经网络离线学习两Agent间的Q值函数映射关系,...
关键词:强化学习 知识迁移 异质Agent Q值 
检索报告 对象比较 聚类工具 使用帮助 返回顶部