Q学习算法

作品数:173被引量:917H指数:16
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:余涛唐昊于乃功周雷吴沧浦更多>>
相关机构:华南理工大学合肥工业大学北京工业大学哈尔滨工业大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划广东省自然科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于双层交互Q学习算法的轴承生产智能排程
《机电工程》2025年第3期451-462,共12页裴志杰 杨晓英 杨欣 杨逢海 
山东省重点研发计划项目(2020CXGCO11001);河南省重点研发专项(231111222600)。
针对带装配的两阶段分布式混合流水车间(TSDHFSSP)环境下的轴承排程问题,提出了一种基于双层交互Q学习算法(DIQLA)的车间调度方法,以解决轴承生产智能排程问题。首先,描述了轴承的排程问题,建立了以最小化最大完工时间为目标的数学模型...
关键词:轴承生产 车间调度方法 智能排程 两阶段分布式混合流水车间 Q学习 双层交互 两阶段联合排程算法 
一种改进强化学习算法的路径规划方法
《计算机技术与发展》2025年第2期115-121,共7页陈松 沈苏彬 
国家重大基础研究计划(973)项目子课题(2011CB302903);江苏省产学研联合创新资金项目(BY2013095108)。
提升Q学习(Q-learning)算法在复杂环境中的数据效率与决策准确度,无疑是算法性能优化所面临的关键挑战。将因果模型引入Q学习算法,通过揭示变量间的因果关系,从而提高Q学习算法的性能是新兴且热门的研究方向。该文提出一种基于因果模型...
关键词:Q学习算法 因果模型 因果推断 混淆因子 后门调整 
基于双Q学习算法的可重入混合流水晶圆车间调度与维护联合优化研究
《建模与仿真》2024年第6期6416-6431,共16页王艺蜚 刘勤明 倪静然 叶春明 汪宇杰 
国家自然科学基金资助项目(71632008,71840003);上海市2021度“科技创新行动计划”宝山转型发展科技专项项目(21SQBS01404);上海理工大学科技发展项目(2020KJFZ038)。
针对可重入晶圆车间调度与预维护问题的复杂性,以及近年来人工智能算法的飞速发展和启发式算法在优化复杂生产系统上的不足,本文提出了一种基于双Q学习的可重入晶圆车间调度与维护联合优化模型。首先,考虑到可重入工序的影响,在调度阶...
关键词:可重入调度模型 双Q学习 多目标优化模型 设备役龄 可重入设备维护模型 
基于双重竞争深度正则化Q学习的干扰探测一体化波形设计
《应用科技》2024年第6期38-44,共7页肖易寒 陈志亮 李虎 刘禹汐 
针对当前雷达电子战中装备的小型化和智能化需求,考虑将探测波形隐藏在干扰波形中,提出了基于深度强化学习的干扰探测一体化波形设计。首先,通过伪随机码噪声调频信号和线性调频信号复合调制完成一体化波形建模;其次,构造速度模糊函数...
关键词:一体化波形设计 正则化Q学习算法 波形优化 模糊函数 正则化 
基于改进Q学习算法的AUV路径规划
《舰船科学技术》2024年第24期92-96,共5页黄昱舟 胡庆玉 熊华乔 
针对欠驱动AUV全局路径规划问题,提出一种轻量级改进Q学习算法。设计距离奖励函数加快学习速率,提高算法稳定性,结合ε贪婪策略和Softmax策略提供一种平衡探索与利用的机制,根据AUV运动约束简化动作集合提高计算时间。仿真结果表明,改...
关键词:自主水下航行器 路径规划 Q学习 Softmax策略 距离奖惩机制 
不确定环境下基于多智能体Q学习的海上风电输电工程电压调整降损优化被引量:1
《中国电机工程学报》2024年第20期7995-8008,I0007,共15页郑弘奇 江岳文 戴锦山 
福建省科技重大专项专题项目“光伏-储能-V2G多能互补系统研制及产业化”(2022HZ028010)。
为了达到海上风电输电工程降损的目的,该文首先详细推导海上风电输电工程海缆传输效率函数,分析海缆传输效率影响因素和有载变压器分接头挡位优化降损原理,建立海缆输电工程日损耗优化模型;其次,考虑降损优化中风电场出力及并网点电压...
关键词:海上风电输电工程 有功降损 有载变压器挡位优化 多智能体Q学习算法 不确定性 
基于规则与Q学习的作业车间动态调度算法被引量:1
《计算机集成制造系统》2024年第10期3535-3546,共12页王艳红 尹涛 谭园园 张俊 李冬 崔悦 
国家自然科学基金青年基金资助项目(62003221);辽宁省重点研发计划资助项目(2020JH2/10100041);辽宁省教育厅重点攻关计划资助项目(LJKZZ20220021)。
为了在特定的作业条件下找到最优调度规则,提高调度规则在不确定动态条件下的自适应、自寻优能力,提出一种调度规则与Q学习算法集成的作业车间动态调度算法。考虑车间中作业随机到达的动态情况,以最小化最大延迟时间为调度目标,在Q学习...
关键词:动态调度 Q学习算法 调度规则 作业车间调度 
基于改进DQN算法的应召搜潜无人水面艇路径规划方法被引量:1
《兵工学报》2024年第9期3204-3215,共12页牛奕龙 杨仪 张凯 穆莹 王奇 王英民 
国家自然科学基金项目(51879221)。
针对应召反潜中无人水面艇航向和航速机动的情形,提出一种基于改进深度Q学习(Deep Q-learning,DQN)算法的无人艇路径规划方法。结合应召搜潜模型,引入改进的深度强化学习(Improved-DQN,I-DQN)算法,通过联合调整无人水面艇(Unmanned Surf...
关键词:无人水面艇 路径规划 深度Q学习算法 应召搜索 
基于启发式Q学习的输电线路无人机避障导航巡检
《机械设计与制造工程》2024年第8期77-80,共4页娄文颖 葛奎 许兆帅 张灿辉 
为提高无人机在输电线路巡检中的安全性,设计一种基于启发式Q学习算法的输电线路无人机自动避障巡检方法。运用多传感器采集外界环境变化信息,经信息融合获得有价值的路径感知信息,得到障碍物位置和可通行路径;采用Q学习算法与启发式函...
关键词:输电线路 巡检无人机 自动避障导航 路径感知信息 启发式Q学习算法 
一种基于一致性的多智能体Q学习算法
《控制工程》2024年第7期1169-1177,共9页崔浩岩 张震 赵德京 廖登宇 
国家自然科学基金资助项目(61903209);青岛市博士后应用研究项目。
针对多智能体系统中智能体通信能力受限和多智能体强化学习中联合动作空间维数灾难问题,提出一种基于一致性的多智能体Q学习(multi-agent Q-learning based on consensus,MAQC)算法。该算法采用集中训练-分散执行框架。在集中训练阶段,M...
关键词:多智能体强化学习 智能体通信 一致性 Q学习 值分解 
检索报告 对象比较 聚类工具 使用帮助 返回顶部