张双民

作品数:5被引量:9H指数:2
导出分析报告
供职机构:清华大学信息科学技术学院计算机科学与技术系更多>>
发文主题:再励学习AGENT语义模型多AGENT系统测试床更多>>
发文领域:自动化与计算机技术理学文化科学更多>>
发文期刊:《清华大学学报(自然科学版)》《计算机研究与发展》《软件学报》《计算机科学》更多>>
所获基金:国家自然科学基金国家高技术研究发展计划更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-5
视图:
排序:
一种基于特征向量提取的FMDP模型求解方法被引量:3
《软件学报》2005年第5期733-743,共11页张双民 石纯一 
国家自然科学基金;国家高技术研究发展计划(863)~~
在诸如机器人足球赛等典型的可分解马尔可夫决策过程(factored Markov decision process,简称FMDP)模型中,不同状态属性在不同的状态下,对于状态评估的影响程度是不同的,其中存在若干关键状态属性,能够唯一或近似判断当前状态的好坏.为...
关键词:群体Agent合作求解 可分解马尔可夫决策过程 线性规划 再励学习 维数灾 
基于群体Agent合作求解的测试床——MAS-Soccer被引量:1
《清华大学学报(自然科学版)》2005年第4期467-470,共4页张双民 石纯一 
国家自然科学基金资助项目(60373079;60496323);国家"八六三"高技术项目(2001AA113120)
为试验和比较各种先进的群体Agent合作求解智能算法,给群体Agent合作策略提供一个比较与测试的平台,该文针对传统的测试平台过分强调具体动作实施细节,忽略合作策略重要性的问题,给出了一种基于信念愿望意图(BDI)逻辑推理的群体Agent合...
关键词:多AGENT 机器人足球赛 再励学习 合作求解 
一种基于角色跟踪的群体Agent再励学习算法
《计算机研究与发展》2005年第2期203-209,共7页张双民 石纯一 
国家自然科学基金项目 (60 173 0 11);国家"八六三"高技术研究发展计划基金项目 (2 0 0 1AA113 12 0 )
在多Agent系统中 ,通过学习可以使Agent不断增加和强化已有的知识与能力 ,并选择合理的动作最大化自己的利益 但目前有关Agent学习大都限于单Agent模式 ,或仅考虑Agent个体之间的对抗 ,没有考虑Agent的群体对抗 ,没有考虑Agent在团队中...
关键词:MAS 再励学习 角色匹配 群体对抗 学习速率 
一种结合环境状态的Agent语义模型被引量:5
《计算机研究与发展》2002年第12期1587-1591,共5页张双民 石纯一 
国家自然科学基金 (69973 0 2 3 ;60 173 0 11);国家"八六三"高技术研究发展计划基金(2 0 0 1AA113 12 0 )资助
在 Agent模型的研究中 ,大部分工作集中在基于 Agent的思维状态 (BDI)的模型 ,没有考虑外部环境的影响 ,或者仅仅将外部环境和内部思维状态笼统混在一起进行分析 ,没有考虑到它们之间的内在联系 .将 Agent的BDI思维属性模型与外部环境...
关键词:环境状态 AGENT 语义模型 思维状态 观察算子 信念 意图 人工智能 
一种基于MAS的Robocup测试床
《计算机科学》2001年第7期91-94,共4页张双民 李毅 石纯一 
Robocup is one of the hot topic in the field of Artificial Intelligence and Automatic Control.In order for a robot to play a soccer game reasonably well,many technologies need to be integrated and a number of technica...
关键词:足球比赛 MAS 测试床 机器人 ROBOCUP 
检索报告 对象比较 聚类工具 使用帮助 返回顶部