序贯决策

作品数:73被引量:366H指数:10
导出分析报告
相关领域:经济管理自动化与计算机技术更多>>
相关作者:李建标巨龙冯允成王浩王渊更多>>
相关机构:北京航空航天大学南开大学西安交通大学大连理工大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金教育部人文社会科学研究基金辽宁省自然科学基金中国博士后科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
得不偿失:序贯决策中的短视风险漠视
《心理科学进展》2024年第12期1980-1989,共10页陈志琴 马家涛 张雪婷 
国家自然科学基金青年项目(72201239)资助。
在日常生活和企业经营中,人们常常因忽视潜在的“高概率、大损失”风险而导致无法挽回的后果。为探究这一现象背后的科学问题,本研究构想首次提出了“短视风险漠视”这一新概念。具体而言,该概念指的是决策者在进行多轮相同或相似决策时...
关键词:短视风险漠视 序贯决策 决策过程 决策目标 
基于PPO算法的集群多目标火力规划方法
《系统工程与电子技术》2024年第11期3764-3773,共10页秦湖程 黄炎焱 陈天德 张寒 
中船创新基金(KJB2023012)资助课题。
针对高动态战场态势下防御作战场景中的多目标火力规划问题,提出一种基于近端策略优化算法的火力规划方法,以最大化作战效能为目标,从弹药消耗、作战效果、作战成本及作战时间4个方面设计强化学习奖励函数。考虑历史决策序列对当前规划...
关键词:多目标火力规划 近端策略优化算法 长短期记忆网络 序贯决策 
基于从众行为和移情关系的区间直觉模糊多属性群决策
《计算机集成制造系统》2024年第9期3288-3298,共11页苏加福 王丹 张凤婷 徐保健 杜俞姵 
重庆市自然科学基金面上资助项目(CSTB2022NSCQ-MSX0478);重庆市教育科学“十四五”规划年度资助项目(2021-GX-343);重庆市教委人文社会科学类研究资助项目(20SKGH110)。
在现实群决策中,决策者常因信息不完全或社会排斥风险而表现出从众行为,同时通过情感移情效应感知他人情感,并将其观点纳入决策之中。但目前群决策研究鲜少考虑从众行为与移情关系的因素。为了拓展群决策的研究范畴和应用领域,提出一种...
关键词:多属性群决策 共识达成 从众行为 移情关系 区间直觉模糊集 序贯决策 
多智能体深度强化学习机制的巡游出租车调度策略优化
《测绘学报》2024年第4期778-778,共1页马祥元 
国家自然科学基金(42071448)。
交通领域传统线性规划方法仅在静态网络中求解有限规模的资源调度问题。论文将动态交通网络中表征乘客和驾驶员出行行为下的时空变化特征、状态属性特征和交互关系特征等领域知识转换映射为包含状态、行为、转移概率和奖励函数等元组的...
关键词:马尔可夫过程 属性特征 深度强化学习 多智能体 动态交通网络 线性规划方法 序贯决策 转移概率 
基于分层深度强化学习的分布式能源系统多能协同优化方法被引量:1
《电力系统自动化》2024年第1期67-76,共10页王磊 胡国 吴海 谭阔 周成 朱亚军 
国家电网公司科技项目(5400-202233168A-1-1-ZN)。
分布式能源系统的多能协同运行对于促进新能源的消纳具有重要意义。然而,分布式能源系统中源荷的不确定性以及异质能源网络的时空差异性,给多能协同优化问题带来巨大挑战。针对这一问题,提出了一种面向分布式能源系统的两阶段多能协同...
关键词:分布式能源系统 新能源 多能协同 序贯决策 深度强化学习 
多直流馈入受端系统与直流联络线协调恢复的一体化建模与求解被引量:6
《电工技术学报》2023年第21期5862-5877,共16页李少岩 曹珂 顾雪平 王帅 
国家自然科学基金(52107092);河北省自然科学基金(E2019502195);中央高校基本科研业务费专项资金(2021MS063)资助项目。
在多馈入系统发生大停电后,选择合适的时机接入直流联络线可以有效推进受端电网的恢复进程。与此同时,交直流之间及多个逆变站间的交互影响,为合理安排直流启动时机及运行出力带来了新的挑战。基于上述背景,该文提出一种能够同时协调关...
关键词:源网协调恢复 “n+1”网络构建法 序贯决策 支路预筛选 混合整数线性规划 
基于卷积注意力网络的卫星观测任务序贯决策方法被引量:2
《郑州大学学报(理学版)》2023年第5期47-52,共6页彭双 伍江江 陈浩 杜春 李军 
国家自然科学基金项目(62106276)。
星上自主任务规划能够提高对地观测卫星应对星上任务、资源变化等动态不确定因素的快速响应能力,是卫星任务规划领域的一个重要研究热点。考虑到星上计算资源有限这一特点,现有研究主要采用启发式搜索算法对卫星星上自主任务规划问题进...
关键词:对地观测卫星 星上自主任务规划 序贯决策 卷积神经网络 注意力机制 
面向人机序贯决策实现共享控制下的仲裁优化
《中国科学:信息科学》2023年第9期1768-1783,共16页张倩倩 赵云波 吕文君 陈谋 
国家重点研究开发项目(批准号:2018AAA0100801);国家自然科学基金(批准号:62173317,62203006);安徽省重点研发计划(批准号:202104a05020064)资助项目。
共享控制存在于众多由人类智能和机器智能共同参与的序贯决策场景.由于人的决策范围和智能机器的决策范围尚未予以明确划分,需要加以实时仲裁从而达到人机共存并且共享决策权限.为此本文提出了一种仲裁优化方法,该方法的独特之处在于引...
关键词:共享控制 仲裁优化 自主性边界 人机序贯决策 强化学习 
强化学习与自适应动态规划:从基础理论到多智能体系统中的应用进展综述被引量:11
《控制与决策》2023年第5期1200-1230,共31页温广辉 杨涛 周佳玲 付俊杰 徐磊 
国家自然科学基金项目(U22B2046,62073079,62088101,62133003,61991403,62173085,62003167);装备预研教育部联合基金项目(8091B022114)。
近年来,强化学习与自适应动态规划算法的迅猛发展及其在一系列挑战性问题(如大规模多智能体系统优化决策和最优协调控制问题)中的成功应用,使其逐渐成为人工智能、系统与控制和应用数学等领域的研究热点.鉴于此,首先简要介绍强化学习和...
关键词:强化学习 自适应动态规划 多智能体系统 马尔科夫决策过程 序贯决策 最优协调控制 
适应随机序贯决策的分布式储能优化规划方法被引量:7
《高电压技术》2022年第11期4385-4392,共8页高松 黄河 李妍 姜家兴 
国家重点研发计划(2017YFB0902800)。
在双碳战略和相关能源政策背景下,为平抑规模化接入分布式能源的潮流随机波动,分布式储能将在配电网逐步推广应用。建立适应随机序贯决策的分布式储能规划模型,将电压幅值、储能动作频次和用电成本作为即时回报优化分布式储能响应,基于...
关键词:分布式储能 优化规划 随机序贯决策 深度强化学习 竞争深度Q网络 光伏 
检索报告 对象比较 聚类工具 使用帮助 返回顶部