Q学习

作品数:761被引量:2791H指数:20
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:唐昊周雷余涛李振龙裴二荣更多>>
相关机构:合肥工业大学南京邮电大学哈尔滨工业大学华南理工大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金中央高校基本科研业务费专项资金国家高技术研究发展计划国家重点基础研究发展计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于Q学习的代理模型辅助优化算法
《信息系统工程》2025年第4期79-82,共4页任志海 
针对目标函数评价昂贵的优化问题,提出一种基于Q学习的代理模型辅助优化算法(QL-SAEA),旨在通过动态策略选择提升算法效率。通过结合Q学习,设计多策略协同机制,利用Kriging模型和径向基函数网络模型捕捉目标函数特征作为代理模型,并集...
关键词:强化学习 Q学习 代理模型 优化算法 
基于集合经验模态分解和Q学习策略的短期负荷预测模型
《现代电力》2025年第2期360-368,共9页段秦尉 何祥针 潮铸 谢祥中 兰萱丽 
中国南方电网有限责任公司科技项目036000KK52210065(GDKJXM20210096)。
短期负荷预测对电力系统的安全稳定运行有着重要意义,为此,提出一种基于集合经验模态分解和Q学习策略优化的短期负荷预测模型。首先,采用集合经验模态分解对原始负荷序列进行分解,以降低预测难度。其次,在此基础上分别采用卷积神经网络...
关键词:短期负荷预测 集合经验模态分解 深度学习模型 Q学习策略 
基于退火Q学习的动态扩频通信抗干扰策略
《无线电通信技术》2025年第2期274-282,共9页刘淼 龚玉萍 任国春 崔丽 罗屹洁 徐逸凡 李欣然 
江苏省青年科技基金(BK20231027)。
传统直接序列扩频(Direct Sequence Spread Spectrum,DSSS)技术在无线通信抗干扰中应用广泛,能够通过扩展频谱带宽改善接收端的输入信噪比,提升通信过程的安全性。随着干扰样式日趋智能化,此类技术在应对未知且动态变化的干扰时,产生了...
关键词:扩频抗干扰 Q学习 马尔可夫决策 
基于BP网络和DQN的预测-校正再入制导方法
《西北工业大学学报》2025年第2期201-211,共11页王宽 闫循良 洪蓓 南汶江 王培臣 
国家自然科学基金(11602296);陕西省自然科学基础研究计划(2019JM-434);智控实验室开放基金(2023-ZKSYS-KF04-02)资助。
针对传统数值预测-校正制导算法计算效率低、难以在线应用等问题,提出了一种基于BP网络和深度Q学习网络(DQN)的预测-校正制导方法。该方法采用纵、侧向制导解耦设计思想,在纵向制导方面,构建并训练了剩余航程预测BP网络,利用预测航程偏...
关键词:再入滑翔制导 预测-校正 BP网络 强化学习 深度Q学习网络 
基于改进强化学习的智慧城市建设中交通信号灯控制方法
《贵阳学院学报(自然科学版)》2025年第1期47-52,共6页周春媚 
交通灯控制系统是智能交通和智慧城市建设的核心组成部分。通过整合传感器数据、交通流量信息和人工智能(AI)算法,交通信号控制(TSC)可实时调节信号灯的时长和切换顺序,缓解交通拥堵,提升道路通行效率。但在动态变化的复杂交通环境中,当...
关键词:智慧城市 交通信号控制 改进Q学习 交叉路口 信号平衡 
基于双层交互Q学习算法的轴承生产智能排程
《机电工程》2025年第3期451-462,共12页裴志杰 杨晓英 杨欣 杨逢海 
山东省重点研发计划项目(2020CXGCO11001);河南省重点研发专项(231111222600)。
针对带装配的两阶段分布式混合流水车间(TSDHFSSP)环境下的轴承排程问题,提出了一种基于双层交互Q学习算法(DIQLA)的车间调度方法,以解决轴承生产智能排程问题。首先,描述了轴承的排程问题,建立了以最小化最大完工时间为目标的数学模型...
关键词:轴承生产 车间调度方法 智能排程 两阶段分布式混合流水车间 Q学习 双层交互 两阶段联合排程算法 
基于改进Q学习的复杂环境下AGV路径规划研究
《计量与测试技术》2025年第3期84-88,94,共6页刘光印 钱东海 王志国 肖子鸣 
针对传统Q-learning算法中存在的搜索效率低、学习速度慢、收敛条件难以有效确定等问题,本文提出一种改进算法,并基于Python tkinter组件,在复杂环境下的栅格地图进行仿真实验。结果表明:该算法能在复杂环境的AGV路径规划条件下找到最...
关键词:Q-learning算法 路径规划 AGV 强化学习 栅格地图 
基于改进约束Q学习的含氢综合能源系统低碳经济优化调度
《电工技术》2025年第4期96-101,共6页廖宇豪 张晓虎 
提出了一种基于改进约束Q学习的含氢综合能源系统低碳经济优化调度方法。在该方法中,首先考虑电解槽-储氢罐-燃料电池氢能转换单元实现系统的低弃风弃光率;其次在含氢综合能源系统中加入碳捕集装置和阶梯碳交易机制,提高系统的低碳性;最...
关键词:含氢综合能源系统 约束Q学习 低碳经济调度 碳捕集 
不可靠通信下基于信誉的联邦学习客户端选择
《测试技术学报》2025年第1期46-53,共8页贾惠景 付芳 张志才 
联邦学习作为一种分布式机器学习框架,因其数据隐私保护特性受到广泛关注,然而,恶意客户端和不可靠通信严重影响了其性能与效率。为了解决上述问题,提出了一种不可靠通信下基于信誉的多任务发布者的联邦学习客户端选择机制。首先,使用...
关键词:联邦学习 不可靠通信 信誉 客户端选择 好奇心驱动的深度Q学习 
基于交通流预测的交通信号灯控制研究
《科学技术创新》2025年第3期93-96,共4页付韵竹 孙海义 吴泉江 张清晨 
辽宁省教育厅科学研究项目(JYTMS20231565);辽宁省大学生创新创业训练计划项目(D202404182138524207)。
随着道路上车流量的不断增多,交通拥堵问题愈加严重。本文提出了一种基于交通流预测对交通信号灯进行控制的一种方法——TFPLight,可以根据交通流量的预测结果提前控制交通信号灯,同时可以根据车流量多少调整绿灯的持续时间:先对交通流...
关键词:交通信号灯控制 深度Q学习 模糊逻辑算法 图注意力机制 
检索报告 对象比较 聚类工具 使用帮助 返回顶部