博弈决策

作品数:73被引量:323H指数:11
导出分析报告
相关领域:经济管理更多>>
相关作者:陈璟皇甫桦彦张振王益文赵晓敏更多>>
相关机构:四川师范大学南京航空航天大学南昌大学中国科学技术大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家社会科学基金教育部人文社会科学研究基金中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于多智能体强化学习的博弈综述
《自动化学报》2025年第3期540-558,共19页李艺春 刘泽娇 洪艺天 王继超 王健瑞 李毅 唐漾 
国家自然科学基金(62233005,U2441245);中国博士后科学基金(2024M750904)资助。
多智能体强化学习(Multi-agent reinforcement learning,MARL)作为博弈论、控制论和多智能体学习的交叉研究领域,是多智能体系统(Multi-agent systems,MASs)研究中的前沿方向,赋予智能体在动态多维的复杂环境中通过交互和决策完成多样...
关键词:多智能体强化学习 多智能体系统 博弈决策 均衡求解 
基于RF-XGBoost算法的无人机多回合攻防博弈决策
《系统工程与电子技术》2025年第2期518-526,共9页邹世培 王玉惠 刘鸿睿 
科技创新2030“新一代人工智能”科技部国家重点研发计划(2018AAA0100805);前瞻布局科研专项项目(ILA220591A22)资助课题。
为解决不平衡空战数据集下的无人机多回合博弈对抗问题,提出一种随机森林-极限梯度提升(random forest-eXtreme gradient boosting, RF-XGBoost)算法以进行攻防博弈决策研究。通过分析红蓝双方的运动状态和空战信息,建立支付矩阵模型,...
关键词:无人机 随机森林 极限梯度提升 多回合博弈 
智能博弈决策策略求解新视角实证分析
《系统仿真学报》2025年第2期345-361,共17页苏炯铭 罗俊仁 陈少飞 
国家自然科学基金(62376280,61806212)。
随着人工智能技术的发展,特别是大型预训练模型理论的推动,智能博奔决策策略求解的一些新视角逐渐受到广泛关注和探讨。结合人工智能技术的发展与智能博奔决策策略求解范式的转变,以国际象棋(两人零和完美信息博奔)、强权外交(多人一般...
关键词:智能博弈决策 策略求解 生成式人工智能 国际象棋 强权外交 预训练 
基于博弈理论的有人/无人平台协同任务决策
《计算机仿真》2024年第11期1-5,共5页刘朝辉 任康瑞 翁世倩 李兵飞 
通过对想定任务场景建模,分析传感器探测、毁伤、干扰等概率信息不确定性,提出不确定性信息下有人/无人平台协同任务博弈决策求解方法。以红蓝双方传感器探测概率、信息干扰概率、武器毁伤概率信息为依据,构建协同任务博弈决策模型。结...
关键词:不确定性信息 有人/无人平台协同 博弈决策 量子粒子群 区间数排序 
重大突发事件下ESG嵌入物流产业供应链均衡决策研究
《商业经济研究》2024年第21期165-168,共4页刘倩斐 
2024年度河南省高校人文社会科学研究一般项目(编号:2024-ZDJH-345)。
重大突发事件极易对物流产业供应链发展产生消极影响,ESG评分为此提供了新的解题思路。本文选择物流产业供应链中物流提供商(S)和物流集成商(J)的Stackelberg博弈行为入手,将ESG嵌入物流产业体系中,构建两类供应链博弈模型,分析ESG评分...
关键词:重大突发事件 ESG 物流产业供应链 博弈决策 
对手类型未知情况下的两人零和马尔科夫博弈决策
《控制理论与应用》2024年第11期2131-2138,共8页王成意 朱进 赵云波 
国家重点研发计划项目(2018AAA0100802);安徽省自然科学基金项目(2008085MF198)资助.
本文研究一类典型的非完全信息博弈问题—-对手类型未知的两人零和马尔科夫博弈,其中对手类型多样且每次博弈开始前无法得知对手类型.文中提出了一种基于模型的多智能体强化学习算法—-对手辨识的极大极小Q学习(DOMQ).该算法首先建立对...
关键词:两人零和马尔科夫博弈 非完全信息 极大极小Q学习 纳什均衡 多智能体强化学习 
多源情报驱动的国家战略博弈可拓决策分析
《计算机工程与应用》2024年第22期126-136,共11页张伟 魏鑫磊 聂芸 杜雁双 牛鹏飞 梁佳 雷霁月 王记坤 
国家重点研发计划(2022YFB3103600)。
国家战略博弈事关国家安全与竞争、军事冲突与战争、危机管控等国家重大战略问题。战略博弈具有宏观性、整体性、前瞻性以及模糊性等特点,相关要素、关系、规则、指标之间复杂关联,量化计算与模型构建是一个难题。目前大部分的战略博弈...
关键词:可拓模型 矛盾识别 国家实力 国家利益 博弈决策 国家战略 
物流企业货运风险评估与成本控制研究——基于货运作业模式风险博弈抉择的成本事前测算方法分析
《价格理论与实践》2024年第10期99-105,共7页何建民 王晨溪 
国家自然科学基金面上项目:面向高卷入度产品的对话式推荐方法研究(编号:72271083)。
电商的高速发展带来物流企业货运业务的飞速增长。物流公司因受运输货品、车辆、储运、包装及时效等多种因素约束,需要在风险与收益之间博弈,进行货运模式抉择,物流企业货运风险评估和货运作业模式抉择便成为其货运成本控制的新问题。...
关键词:中小物流企业 货运作业风险评估 风险—收益博弈决策 事前成本测算 
考虑消费者感知效用的平台电商定价与返利策略研究被引量:1
《商业经济研究》2024年第10期113-117,共5页廖银燕 
目前,电商消费在便捷化支付方式和精细化供应链管理的支撑下已经成为当前居民消费的重要组成部分。随着线上消费市场的流量下沉,平台电商发展的关键是通过满足消费者碎片化需求提升消费者感知效用,即消费者对平台电商的情感在反复互动...
关键词:消费者感知 电商平台 定价与返利 博弈决策 
基于机器学习的航天器规避目标威胁博弈决策
《航空学报》2024年第8期244-259,共16页张鸿林 罗建军 马卫华 
国家自然科学基金(12072269);航天飞行动力学技术重点实验室基金(6142210210302)。
针对航天器规避空间目标抵近威胁的决策问题,提出了一种智能决策框架和基于深度强化学习的自主决策方法。考虑到空间目标的机动特性和威胁规避的博弈性,基于感知-判断-决策-执行(OODA)环决策思想和机器学习方法,提出了一种航天器威胁规...
关键词:航天器机动 智能决策 威胁规避 OODA环 深度强化学习 
检索报告 对象比较 聚类工具 使用帮助 返回顶部