杨宛璐

作品数:3被引量:3H指数:1
导出分析报告
供职机构:广东工业大学自动化学院更多>>
发文主题:性能势足球机器人启发式搜索信任评估云计算更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《计算机仿真》《计算机工程与设计》《微电子学与计算机》更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-3
视图:
排序:
基于性能势的A*平均奖赏强化学习算法研究被引量:2
《计算机仿真》2014年第7期338-341,共4页黄浩晖 杨宛璐 陈玮 
强化学习和性能势理论是当前人工智能领域的研究热点,RoboCup足球机器人仿真为人工智能和机器人学研究提供了一个良好的实验平台,针对强化学习和性能势理论在足球机器人仿真应用中求解过程不稳定和收敛速度过慢问题,提出了一个新的强化...
关键词:强化学习 性能势 启发式搜索 半马尔科夫决策过程 
云环境下基于双滑动窗口的供应商信任评估机制研究被引量:1
《微电子学与计算机》2014年第6期158-161,共4页杨宛璐 王磊 
提出了一种基于企业行为证据的双滑动窗口的供应商信任量化评估机制,通过不断滑动的窗口,确定窗口更新和替换的内容以保证企业行为信任评估的可信性和可扩展性.仿真实验分析表明,该模型提供了云环境下供应商信任值计算的动态性,评估方...
关键词:云计算 信任评估 双滑动窗口 
性能势算法研究及在RoboCup中的应用
《计算机工程与设计》2014年第3期905-908,共4页杨宛璐 陈玮 黄浩晖 王广涛 
强化学习是人工智能领域中解决学习控制的一种重要方法。在强化学习算法中,平均奖赏强化学习是以平均奖赏值作为参照标准,适用于解决具有循环特性或不具终结状态的问题,其存在参数和环境的敏感及收敛速度慢等问题,并且强调的是单个智能...
关键词:足球机器人 强化学习 性能势 G-learning算法 多智能体系统 
检索报告 对象比较 聚类工具 使用帮助 返回顶部