交互式动态影响图

作品数:12被引量:16H指数:3
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:罗键曹浪财李波田乐武鹤更多>>
相关机构:厦门大学深圳大学解放军信息工程大学江西财经大学更多>>
相关期刊:《模式识别与人工智能》《控制与决策》《科技经济导刊》《厦门大学学报(自然科学版)》更多>>
相关基金:国家自然科学基金福建省重大科技项目江西省社会科学规划项目江西省自然科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
交互式动态影响图研究及其最优K模型解法被引量:3
《计算机学报》2018年第1期28-46,共19页潘颖慧 曾一锋 
国家自然科学基金(61375070;61562033;61772442;71361011);江西省社会科学规划基金(16GJ20);江西省自然科学基金(20171BAB202022)资助~~
不确定性多智能体序贯决策是人工智能研究领域一个重要的研究问题,主要求解智能体如何在与其他智能体的交互中优化本身的决策.特别在部分可观测的随机博弈设置下,智能体不能探测到真实的外部环境状态,必须依靠所接收的观察来推断可能的...
关键词:多智能体系统 影响图 序贯决策问题 行为等价 
基于交互式动态影响图的对手建模被引量:4
《控制与决策》2016年第4期635-639,共5页罗键 武鹤 
国家自然科学基金项目(61375070);福建省重大科技项目(2011H6027)
在充满竞争的环境中,资源有限导致智能体之间存在利益冲突,有必要建立对手模型并对其行为进行准确预测,从而制定对自身有利的策略.利用交互式动态影响图对未知对手进行建模,将对手的候选模型保存在模型节点并随时间更新其信度.结合观测...
关键词:交互式动态影响图 多智能体 对手建模 策略树 
基于交互式动态影响图的决策模型及算法分析被引量:1
《科技经济导刊》2016年第3期3-4,28,共3页鲁桂芳 
交互式动态影响图(interactive dynamic influence diagrams)是不确定环境下多Agent(Mult-Agent)序贯决策(Sequential Decision)的图模型[1]。马尔可夫决策过程可以用来描述和处理大规模不确定性环境下的Agent决策问题。本文以马尔可夫...
关键词:交互式动态影响图 马尔可夫决策过程 Agent决策 
多智能体对手建模及其真实模型的确定被引量:1
《华中科技大学学报(自然科学版)》2015年第10期48-52,共5页罗键 武鹤 曹浪财 
国家自然科学基金资助项目(60975052;61375070);福建省重大科技资助项目(2011H6027)
针对如何在竞争环境中更好地预测对手行为,并正确制定自身相应的对策进行研究.利用交互式动态影响图对环境中的对手智能体进行建模,并结合贝叶斯网络提出了一种判断对手真实模型的方法.首先,将对手智能体的候选模型保存在模型节点中并...
关键词:多智能体 对手建模 交互式动态影响图 动态贝叶斯网络 策略 
基于lookahead的交互式动态影响图的DMU改进算法
《系统工程与电子技术》2014年第6期1201-1206,共6页田乐 曹浪财 
国家自然科学基金(61375070)资助课题
区别模型更新(discriminative model update,DMU)是一种常用的求解交互式动态影响图(interactive dynamic influence diagrams,I-DIDs)问题的算法。结合lookahead思想提出了一种判断模型近似行为等价的改进DMU方法。所提方法首先将满足...
关键词:多AGENT 决策 交互式动态影响图 行为等价 近似行为等价 前瞻 
多Agent交互动态影响图的近似行为等价算法被引量:2
《华中科技大学学报(自然科学版)》2014年第4期60-63,共4页田乐 罗键 曹浪财 
国家自然科学基金资助项目(61375070)
结合前瞻搜索思想提出了一种判断模型近似行为等价的方法,首先通过比较候选模型的部分解(即策略树)判断模型近似行为等价,然后自上而下对近似行为等价模型进行快速聚类和修剪,利用代表模型将交互式动态影响图扩展成为平铺动态影响图,最...
关键词:多智能体 分布式人工智能 交互式动态影响图 行为等价 策略树 信度 
基于KL距离的交互式动态影响图近似算法被引量:2
《系统工程与电子技术》2013年第1期207-211,共5页田乐 罗键 曹浪财 陈志平 
国家自然科学基金(60975052)资助课题
交互式动态影响图(interactive dynamic influence diagrams,I-DIDs)状态空间太大,候选模型的数量随时间变化而呈指数倍增长。针对其备受计算量困扰的问题,提出一种利用近似行为等价原理与区别模型更新算法(discriminative model update...
关键词:多AGENT决策 交互式动态影响图 行为等价 近似行为等价 Kullback—Leibler(KL)距离 
多Agent交互式动态影响图的建模方法被引量:2
《厦门大学学报(自然科学版)》2012年第6期985-990,共6页潘颖慧 罗键 曾一锋 
国家自然科学基金项目(60975052);江西省教育厅科技重点项目(GJJ10695)
交互式动态影响图是一种以动态影响图为基础,利用有向图构造Agent之间交互作用的决策概率模型,目前只能解决2个Agent的问题.根据概率图模型理论、交互式部分可观测马尔可夫决策过程性质、最大奖励期望值原理等以3个Agent为例建立多Agen...
关键词:交互式动态影响图 多AGENT建模 概率图模型 
交互式动态影响图的一种近似求解算法被引量:3
《华中科技大学学报(自然科学版)》2011年第10期64-68,共5页李波 罗键 庄进发 尹华一 
国家自然科学基金资助项目(60975052)
提出一种基于行为等价原理分段处理交互式动态影响图(I-DID)的近似算法:先将底层I-DID模型分解成包含若干时间片的子片段,求解首片段,获得各模型的策略树,并依行为等价原理合并策略树,形成策略图,其结果作为下一片段的初始模型,再进行求...
关键词:多AGENT系统 AGENT建模 动态决策 交互式动态影响图 行为等价 最小模型集 
交互式动态影响图及其精确求解算法被引量:1
《解放军理工大学学报(自然科学版)》2011年第2期119-124,共6页李波 曹浪财 庄进发 
国家自然科学基金资助项目(60975052)
为了表示部分可观察马尔可夫环境下,多Agent决策中各Agent之间的动态结构关系,对影响图(IDs)在结构和时间上进行扩展,形成一种能够对其他Agent建模的决策模型:交互式动态影响图(I-DIDs)。I-DIDs是不确定环境下多Agent进行序贯决策的图...
关键词:多AGENT决策 交互式动态影响图 行为等价 最小模型更新集 
检索报告 对象比较 聚类工具 使用帮助 返回顶部