半马尔可夫决策过程

作品数:22被引量:120H指数:6
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:唐昊周雷高阳程文娟马学森更多>>
相关机构:合肥工业大学江南大学南京大学西南交通大学更多>>
相关期刊:《计算机应用研究》《长春师范大学学报》《北京邮电大学学报》《合肥工业大学学报(自然科学版)》更多>>
相关基金:国家自然科学基金安徽省自然科学基金教育部“新世纪优秀人才支持计划”国家教育部博士点基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于SMDP模型的车路协同任务智能卸载算法被引量:2
《北京邮电大学学报》2023年第2期15-21,共7页李晓辉 苏家楠 吕思婷 张鹏 
在车路协同系统中,车辆的高机动性会使边缘节点难以控制计算时延。对此,提出了基于半马尔可夫过程的任务卸载策略,定义了道路服务节点的优先级队列、状态空间、行为空间、系统收益和转移概率,用于构建任务等待队列模型。通过在服务节点...
关键词:边缘计算 车路协同 任务卸载 半马尔可夫决策过程 
深度分层强化学习研究与发展被引量:9
《软件学报》2023年第2期733-760,共28页黄志刚 刘全 张立华 曹家庆 朱斐 
国家自然科学基金(61772355,61702055,61876217,62176175);江苏省高等学校自然科学研究重大项目(18KJA520011,17KJA520004);吉林大学符号计算与知识工程教育部重点实验室资助项目(93K172014K04,93K172017K18,93K172021K08);苏州市应用基础研究计划工业部分(SYG201422);江苏高校优势学科建设工程资助项目。
深度分层强化学习是深度强化学习领域的一个重要研究方向,它重点关注经典深度强化学习难以解决的稀疏奖励、顺序决策和弱迁移能力等问题.其核心思想在于:根据分层思想构建具有多层结构的强化学习策略,运用时序抽象表达方法组合时间细粒...
关键词:人工智能 强化学习 深度强化学习 半马尔可夫决策过程 深度分层强化学习 
基于网络切片的移动雾计算系统资源调度策略
《长春师范大学学报》2022年第8期17-25,共9页张小佳 文鹏 唐胜达 
针对基于网络切片的移动雾计算系统资源调度策略进行研究.系统根据切片的业务需求,制定各类业务的切片,将网络切片划分优先级,MFC系统中移动用户的计算请求接入对应的网络切片,并为其分配一定的资源以满足基本需求.本文在基于网络切片的...
关键词:网络切片 移动雾计算系统 半马尔可夫决策过程 VM分配 
面向用户需求的空天地一体化车载网络任务分配策略被引量:2
《系统工程与电子技术》2022年第5期1717-1727,共11页谭诗翰 金凤林 顿聪颖 
为了提高空天地一体化车载网络(space-air-ground integrated vehicular networks,SAGVN)内用户的网络服务质量体验,解决不同网络间相互协同的问题,提出了面向用户需求的SAGVN任务分配策略。基于用户信号强度、时延、网络费用和带宽需求...
关键词:空天地一体化车载网络 无线网络管理 半马尔可夫决策过程 用户需求 Q-learning算法 
基于需求驱动的CSPS系统多目标优化控制
《系统工程理论与实践》2020年第4期1069-1079,共11页谭琦 胡知强 唐昊 戴飞 
国家重点研发计划(2017YFE0129700);国家自然科学基金(61573126);中央高校基本科研业务费专项资金(JZ2017YYPY0261)。
本文以最小化顾客流失率和最小化成品库平均在库数量为优化目标,研究基于需求驱动的传送带给料加工站(CSPS)系统的多目标优化问题.给出了前视距离控制和库存控制两种控制方式,并建立基于需求驱动的CSPS系统多目标优化模型.通过半马尔可...
关键词:需求驱动 传送带给料加工站 多目标优化 半马尔可夫决策过程 
车载云计算系统中资源分配的优化方法被引量:5
《中国电子科学研究院学报》2020年第1期92-98,共7页董晓丹 吴琼 
国家自然科学基金(61701197);江苏省高职院校教师专业带头人高端研修项目(2019GRGDYX049);江苏信息职业技术学院重点科研课题(JSITKY201901)。
随着车联网(IoV)应用服务的发展,提升网络的任务卸载能力成为满足用户服务需求的关键。文中针对动态场景中车辆计算资源共享问题,提出了车载云计算(VCC)系统的最优计算资源分配方案,以实现任务卸载能力的提升。该方案将VCC系统中任务卸...
关键词:车载云计算 半马尔可夫决策过程 忙碌车辆 资源分配 
铁路客运票额预售控制决策模型研究被引量:9
《铁道学报》2018年第1期17-23,共7页刘帆洨 彭其渊 梁宏斌 杨奎 
国家自然科学基金(61571375);中国铁路总公司科技研究开发计划(2016X008-J)
客票发售是列车能力利用的具体表现,票额出售即为能力占用,预售期购票需求的变化直接影响着列车能力的占用过程。本文在已知基于列车沿途停靠站的票额分配计划下,以客流需求预测值和最低票额保护值为约束。考虑预售期购票趋势与不同OD...
关键词:铁路客运 票额预售 控制决策 半马尔可夫决策过程 最大期望票价收益 
分层强化学习综述被引量:20
《智能系统学报》2017年第5期590-594,共5页周文吉 俞扬 
国家自然科学基金项目(61375061);江苏省自然科学基金项目(BK20160066)
强化学习(reinforcement learning)是机器学习和人工智能领域的重要分支,近年来受到社会各界和企业的广泛关注。强化学习算法要解决的主要问题是,智能体如何直接与环境进行交互来学习策略。但是当状态空间维度增加时,传统的强化学习方...
关键词:人工智能 机器学习 强化学习 分层强化学习 深度强化学习 马尔可夫决策过程 半马尔可夫决策过程 维度灾难 
基于SMDP的光柴储独立微网能量控制策略优化被引量:4
《电力系统自动化》2016年第21期154-160,共7页周康 唐昊 江琦 吕凯 蒋兰海 
国家自然科学基金资助项目(61573126);教育部新世纪优秀人才计划资助项目(NCET-11-0626);高等学校博士学科点专项科研基金资助项目(20130111110007)~~
考虑含光伏发电装置、储能装置和柴油发电机组的独立微网系统,以提高微网长期运行经济性为目标,研究微网能量管理优化问题。首先对系统的随机动态特性进行建模,即针对光伏发电和负荷变化的随机特性,将微网系统的能量控制建模为半马尔可...
关键词:微网(微电网) 光伏发电 储能 半马尔可夫决策过程 
服务率不确定的单站点传送带给料加工站系统鲁棒优化控制
《计算机应用》2015年第7期2067-2072,共6页黄浩 唐昊 周雷 程文娟 
国家自然科学基金资助项目(61174186;61374158;51274078);教育部新世纪优秀人才计划项目(NCET-11-0626);高等学校博士学科点专项科研基金资助项目(20130111110007)
研究了服务率不确定情况下的单站点传送带给料加工站(CSPS)系统的鲁棒优化控制问题。在仅知服务率区间的条件下,以CSPS系统的前视距离作为控制变量,将鲁棒优化控制问题建模成不确定参数的半马尔可夫决策过程(SMDP)的极大极小优化问题,...
关键词:传送带给料加工站 半马尔可夫决策过程 不确定服务率 全局优化 鲁棒控制策略 
检索报告 对象比较 聚类工具 使用帮助 返回顶部