检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]厦门大学信息科学与技术学院,福建厦门361005
出 处:《厦门大学学报(自然科学版)》2012年第6期985-990,共6页Journal of Xiamen University:Natural Science
基 金:国家自然科学基金项目(60975052);江西省教育厅科技重点项目(GJJ10695)
摘 要:交互式动态影响图是一种以动态影响图为基础,利用有向图构造Agent之间交互作用的决策概率模型,目前只能解决2个Agent的问题.根据概率图模型理论、交互式部分可观测马尔可夫决策过程性质、最大奖励期望值原理等以3个Agent为例建立多Agent交互式动态影响图(I-MADIDs)模型,探讨除建模Agent之外,其他非建模Agent之间存在稳定关系时,如何简化I-MADIDs模型.最后对老虎问题进行建模,利用HUGIN7.0对其进行求解,分别讨论了建模A-gent和其他Agent的决策情况,对比了精确方法和简化模型中贝叶斯参数学习近似方法中Agent的决策情况,证明了近似方法的有效性.Interactive dynamic influence diagrams (I-DIDs) are a kind of probability graph models based on dynamic influence dia grams,using directed graph to construct decision-making models about interaction between agents. I-DIDs can only solve 2 agents' problems. Take 3 Agents for example,the paper tries to model interactive multi-agent dynamic influence diagrams (I-MADIDs) by means of probabilistic graph model theory,interactive partially observable Markov decision process nature and the principle of maxi- mum reward expectations,and explores how to simply I-MADIDs when there is the stable relationship between non modeling agents. Finally,we model the tiger problem, solve models using HUGIN7. 0, and discuss separately various decision-making cases for the modeling agent and other agents. Examples prove the validity of the approximate method based on Bayesian parameter learning through comparing the exact and approximate methods.
分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.90