MARKOV对策

作品数:13被引量:86H指数:5
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:许晓鸣李晓萌杨煜普张化祥高阳更多>>
相关机构:上海交通大学南京大学西北工业大学南京航空航天大学更多>>
相关期刊:《计算机技术与发展》《中国机械工程》《计算机工程与应用》《信息与控制》更多>>
相关基金:国家自然科学基金中央级公益性科研院所基本科研业务费专项国家教育部博士点基金国家高技术研究发展计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于分布式强化学习算法的精准助学数据分析方法研究
《电子设计工程》2021年第10期28-31,36,共5页邢文娜 宁睿 
2019年陕西高校辅导员工作研究课题(2019FKT35)。
针对传统助学金评选方法中存在虚假申请材料难以鉴别、无法准确了解学生真实经济水平的问题。文中提出了基于分布式强化学习算法的精准助学数据分析方法,该方法通过收集数字化校园中学生的各项消费数据,经过数据预处理后找出具有分类能...
关键词:分布式强化学习算法 精准助学数据分析技术 归一化RBF神经网络 MARKOV对策 BAYESIAN网络 
基于Markov对策的机械臂二维路径规划
《计算机技术与发展》2012年第5期57-59,63,共4页陈魁 刘久富 苏青琴 刘蓉 
国家自然科学基金(60674100);南京航空航天大学基本科研业务费专项科研项目(NS2010069)
针对机械臂应用环境状况较复杂、不确定条件较多,文中使用基于Markov对策的算法对二维机械臂进行路径规划。二维机械臂路径规划是三维多关节机器人规划的基础。首先根据实际的工作环境设定机械臂的运动范围并选择经常出现的动作组合作...
关键词:多关节机器人 机械臂 多AGENT系统 MARKOV对策 NASH均衡 
基于Markov对策的码垛机器人三维路径规划被引量:4
《中国机械工程》2012年第7期851-855,共5页刘久富 陈魁 苏青琴 梁娟娟 王志胜 
国家自然科学基金资助项目(60674100);南京航空航天大学基本科研业务费专项科研项目(NS2010069)
针对码垛机器人应用环境状况较复杂、不确定条件较多的问题,使用基于Markov对策的算法对多关节码垛机器人进行路径规划。首先根据实际的工作环境设定机器人的运动范围,并选择经常出现的动作组合作为机器人运动的基本行为集,给出各种情...
关键词:码垛机器人 多关节机器人 多AGENT系统 MARKOV对策 NASH均衡 
基于后悔值的多Agent冲突博弈强化学习模型被引量:6
《软件学报》2008年第11期2957-2967,共11页肖正 张世永 
对于冲突博弈,研究了一种理性保守的行为选择方法,即最小化最坏情况下Agent的后悔值.在该方法下,Agent当前的行为策略在未来可能造成的损失最小,并且在没有任何其他Agent信息的条件下,能够得到Nash均衡混合策略.基于后悔值提出了多Agen...
关键词:MARKOV对策 强化学习 冲突博弈 冲突消解 
Robocup半场防守中的一种强化学习算法
《计算机技术与发展》2008年第1期59-62,共4页冯林 李琛 孙焘 
国家自然科学基金(50575031)
Robocup仿真比赛是研究多Agent之间协作和对抗理论的优秀平台,提高Agent的防守能力是一个具有挑战性的问题。为制定合理的防守策略,将Robocup比赛中的一个子任务——半场防守任务分解为多个一对一防守任务,采用了基于Markov对策的强化...
关键词:ROBOCUP 强化学习 MARKOV对策 零和对策 
一般和对策中基于协商的多代理强化学习
《上海交通大学学报》2005年第S1期108-112,共5页张化祥 赵彤 黄上腾 
一般和对策中,只考虑个体理性的多代理协作是一种无全局目标的协作.代理学习基于对手策略假设,不能保证假设的正确性.为此通过定义代理协作的集体目标,提出了一种基于多代理协商的代理强化学习算法.代理选择协商策略,并惩罚偏离该策略...
关键词:MARKOV对策 强化学习 多代理协作 协商 
基于Markov对策的多智能体协调方法及其在Robot Soccer中的应用被引量:5
《机器人》2005年第1期46-51,共6页范波 潘泉 张洪才 
提出了一种分层的基于Markov对策的多智能体协调方法 ,根据多智能体之间的竞争和合作的关系 ,高层采用零和Markov对策解决与对手之间的竞争 ,低层采用团队Markov对策完成与团队内部的合作 .通过在RobotSoccer中的应用和实验 ,说明了基于...
关键词:多智能体 MARKOV对策 零和Markov对策 团队Markov对策 ROBOT SOCCER 
基于强化学习与对策的多代理协同技术被引量:3
《计算机科学》2004年第8期116-119,共4页张化祥 黄上腾 
本文从强化学习与 Markov 对策相结合方面考察了多代理协同技术的发展,系统地分析了已有的研究成果,并指出基于强化学习与对策的多代理协同技术研完中存在的问题及未来研究方向。
关键词:多代理协同 强化学习 MARKOV对策 分布式人工智能 
基于多级决策的多智能体自动导航车调度系统被引量:11
《上海交通大学学报》2002年第8期1146-1149,共4页李晓萌 杨煜普 许晓鸣 
国家自然科学基金资助项目 (60 1743 0 8)
提出基于多级决策和协作学习的方法来建立自动导航车 ( AGV)调度系统中每个 AGV所需要的动态分布式调度策略 .系统中的每一个 AGV都由一个具有两级决策能力的智能体控制 :在选择级 ,智能体采用 Markov对策框架下的强化学习方法 ,以根据...
关键词:多智能体 自动导航车 调度系统 多级决策 MARKOV对策 强化学习 动态分布式调度策略 
多智能体协作技术综述被引量:28
《信息与控制》2001年第4期337-342,共6页杨煜普 李晓萌 许晓鸣 
国家重点科学基金支持 ( 39930 0 70 )
本文从协作模型和研究方法两个角度考察了多智能体协作技术的发展 ,认为是外在的理性形式化模型和内在的对策和学习机制是多智能体协作技术的两个重要方面 .
关键词:多智能体协作 自协调模型 递归建模 MARKOV对策 智能控制 
检索报告 对象比较 聚类工具 使用帮助 返回顶部