王云

作品数:5被引量:9H指数:1
导出分析报告
供职机构:南京财经大学信息工程学院更多>>
发文主题:多智能体系统多智能体强化学习多智能体电子市场协商更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《计算机工程与应用》《山东大学学报(工学版)》《南京师范大学学报(工程技术版)》《计算机应用》更多>>
所获基金:国家自然科学基金江苏省教育厅自然科学基金江苏省“青蓝工程”基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-5
视图:
排序:
基于进化算法的多智能体合作学习被引量:1
《山东大学学报(工学版)》2010年第6期8-11,共4页王云 王俊 韩伟 
国家自然科学基金资助项目(70802025)
强化学习的收敛速度随状态-动作空间的维数呈指数增长,因此在涉及大的状态空间时,强化学习算法的收敛速度非常慢以至不能满足应用需求。在许多应用环境中,若智能体之间存在合作关系,借助多个智能体进行分布式学习可以部分解决这一问题...
关键词:多智能体系统 合作学习 进化算法 
一种基于划分和集成思想的多智能体强化学习被引量:1
《南京师范大学学报(工程技术版)》2008年第4期59-62,共4页王云 韩伟 
国家自然科学基金(70802025)资助项目
针对Q学习状态空间非常大,导致收敛速度非常慢的问题,利用智能体在不同样本上分类性能不同,提出了基于样本的学习误差对样本空间进行划分,充分发掘了样本和智能体的匹配关系.以带障碍物的格子世界作为仿真环境,表明该算法提高了在线学...
关键词:多智能体系统 强化学习 状态空间划分 
对称协调博弈问题的多智能体强化学习被引量:2
《计算机工程与应用》2008年第36期230-233,248,共5页王云 韩伟 
国家自然科学基金(No.70802025);江苏省教育厅"青蓝工程"项目;江苏省教育厅自然科学指导计划项目(No.07KJD520070)~~
针对多机器人协调问题,利用协调博弈中智能体策略相似性,提出智能体的高阶信念修正模型和学习方法PEL,使智能体站在对手角度进行换位推理,进而根据信念修正将客观观察行为和主观信念推理结合起来。证明了信念修正模型的推理置信度只在0...
关键词:多智能体系统 强化学习 协调博弈 
一种基于多agent学习的电子市场智能定价方法
《计算机工程与应用》2007年第15期208-211,共4页韩伟 王云 吕捷 
江苏省教育厅"青蓝工程"优秀青年骨干教师计划。
B2B电子市场的定价问题是一个半学习半推理的连续决策过程,每个定价agent不是直接采用多agent学习算法下的均衡策略,而是根据博弈历史进行推理决策,并不断学习对手的策略。提出了基于内省推理方法的多agent环境下agent高效在线学习方法...
关键词:多AGENT系统 在线学习 内省推理 电子市场 
基于多智能体协商的电子市场原料配置模型被引量:5
《计算机应用》2006年第12期3008-3011,共4页韩伟 王云 陈优广 
基于市场交互机制建立了多智能体之间的协商模型,每个企业看作自利智能体运行生产规划算法购置原料并安排生产,市场智能体作为中间人通过市场规则对智能体的个体选择进行综合并将综合后的结果反馈给每个智能体,这一机制较好地总结了各...
关键词:多智能体系统 协商 市场机制 
检索报告 对象比较 聚类工具 使用帮助 返回顶部