Q-LEARNING

作品数:364被引量:1051H指数:14
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:杨睿哲李萌张延华郭洪强熊丽荣更多>>
相关机构:西安电子科技大学北京工业大学北京邮电大学东南大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金中国博士后科学基金国家高技术研究发展计划中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于改进Q-Learning算法的机器人路径规划
《物联网技术》2025年第3期82-86,共5页潘琦涛 赵岳生 甘育国 
广西科技大学博士基金项目:人工智能理论与三维视景实验室建设(校科博21Z27)。
移动机器人的路径规划问题受到了广大学者的关注。当机器人在未知环境中进行路径规划时,为了提高规划的效率,通常需要获取相关的先验知识。在强化学习路径规划中,先验知识可以通过多种方式融入到算法中,其中Q-Learning算法是一种常用的...
关键词:Q-LEARNING ROS机器人 强化学习 路径规划 径向基函数 探索策略 
面向物流机器人的改进Q-Learning动态避障算法研究
《计算机测量与控制》2025年第3期267-274,共8页王力 赵全海 黄石磊 
中国航发产学研合作项目(HFZL2021CXY007);航空发动机及燃气轮机基础科学中心项目(P2022-B-V-002-001)。
为提升物流机器人(AMR)在复杂环境中的自主导航与避障能力,改善传统Q-Learning算法在动态环境中的收敛速度慢、路径规划不够优化等问题;研究引入模糊退火算法对Q-Learning算法进行路径节点和搜索路径优化,删除多余节点和非必要转折;并...
关键词:物流机器人 Q-Learning算法 DWA 多目标规划 障碍物 避障 
考虑装配序列变化与双资源约束的模糊柔性装配作业车间调度研究
《制造技术与机床》2025年第3期166-179,共14页路鑫 鲁聪 
四川省科技计划项目(2021YJ0034)。
提出一种考虑装配序列变化与双资源约束的模糊柔性装配作业车间调度(fuzzy flexible assembly job shop scheduling considering assembly sequence variationunder dual resource constraints,FFAJSS-ASVDRC)方法,以实现在双资源约束(...
关键词:柔性装配作业车间调度 双资源约束 装配序列 Q-LEARNING NSGA-Ⅱ 
电力调度系统中分布式能源的协调控制策略
《家电维修》2025年第3期128-130,共3页胡瑞东 
随着全球能源需求的不断增长和环境问题的日益严重,分布式能源系统因其高效、灵活和环保的特性,逐渐成为现代电力系统的重要组成部分。本文提出了一种基于遗传算法和自适应多代理系统的分布式能源优化调度方法。首先,通过遗传算法优化...
关键词:分布式能源系统 遗传算法 自适应多代理系统 Q-LEARNING 
风电机组总装环境中基于Q-learning的AGV路径规划
《工业控制计算机》2025年第3期62-64,共3页张政 
AGV的路径规划是影响总装工作效率的关键因素之一,合理的路径规划对于AGV的高效工作非常重要。由于风机总装环境中节点较多、计算量较大,现有的路径规划算法存在着局限性。提出了一种适用于风机总装环境的AGV路径规划算法。该算法是根...
关键词:风电机组总装环境 AGV路径规划 Q-LEARNING 最短路径 
基于Q-Learning的MEC多用户多信道的任务卸载研究
《吉林大学学报(信息科学版)》2025年第1期1-7,共7页任晶秋 王子贤 
国家自然科学基金资助项目(62271447)。
为降低MEC(Mobile Edge Computing)系统的总开销,将所有设备的延迟和能量消耗的加权总和设定为优化目标,解决了多用户多信道移动边缘计算系统中的任务卸载问题。该方案能使多个用户设备通过无线信道将计算负荷重的任务卸载到MEC服务器...
关键词:移动边缘计算 计算卸载 信道选择 能量因子 
基于Q-learning算法的机场航班延误预测
《航空计算技术》2025年第1期28-32,共5页刘琪 乐美龙 
国家自然科学基金项目资助(71471110);南京航空航天大学研究生创新基地开放基金项目资助(xcxjh20220721)。
将改进的深度信念网络(DBN)和Q-learning算法结合建立组合预测模型。首先将延误预测问题建模为一个标准的马尔可夫决策过程,使用改进的深度信念网络来选择关键特征。经深度信念网络分析,从46个特征变量中选择出27个关键特征类别作为延...
关键词:航空运输 航班延误预测 深度信念网络 Q-LEARNING 航班延误 
基于改进Q-learning的AGV路径规划研究
《物流科技》2025年第1期28-33,共6页杨子豪 卢益清 
国家自然科学基金项目“基于集成模型的网络行为数据流敏感目标挖掘与检测技术研究”(U1936111)。
针对AGV路径规划中的收敛速度慢和路径动态调整的问题,提出了一种改进的Q-learning算法。首先,引入了曼哈顿距离作为额外的启发信息,结合Q-learning算法进行路径规划,以加速算法的收敛速度。其次,增加了故障点的考虑,并在路径规划过程...
关键词:路径规划 曼哈顿距离 动态调整 货物收集 
基于强化学习的考虑运输资源分布式调度问题
《机床与液压》2025年第1期43-51,共9页唐红涛 廖义峰 
国家自然科学基金项目(51705384;52075401)。
分布式车间调度问题在传统制造业中具有重要意义。然而,在实际生产过程中,各种加工资源通常是有限的,且在以往分布式调度问题中未考虑到。针对分布式工厂运输机器有限问题,提出一种基于强化学习的RLDE算法。分析并建立RLDE的自学习模型...
关键词:分布式作业车间调度 Q-LEARNING 资源约束 多目标优化 
改进的自校正Q-learning应用于智能机器人路径规划
《机械科学与技术》2025年第1期126-132,共7页任伟 朱建鸿 
国家自然科学基金项目(61973139)。
为了解决智能机器人路径规划中存在的一些问题,提出了一种改进的自校正Q-learning算法。首先,对其贪婪搜索因子进行了改进,采用动态的搜索因子,对探索和利用之间的关系进行了更好地平衡;其次,在Q值初始化阶段,利用当前位置和目标位置距...
关键词:路径规划 Q-LEARNING 贪婪搜索 初始化 自校正 
检索报告 对象比较 聚类工具 使用帮助 返回顶部