云南高校图书馆联盟文献共享服务平台- 强化学习算法

公共卫生与预防医学

营养与食品卫生学

人体解剖和组织胚胎学

航空、航天与航海医学

影像医学与核医学

血液循环系统疾病

神经病学与精神病学

皮肤病学与性病学

微生物与生化药学

农业机械化工程

农业电气化与自动化

作物栽培与耕作技术

农业昆虫与害虫防治

木材科学与技术

特种经济动物饲养

材料科学与工程

矿井通风与安全

石油与天然气工程

油气田开发工程

冶金机械及自动化

金属切削加工及机床

机械设计及理论

机械制造及自动化

仪器科学与技术

精密仪器及机械

测试计量技术及仪器

兵器科学与技术

兵器发射理论与技术

武器系统与运用工程

火炮、自动武器与弹药工程

军事化学与烟火技术

动力工程及工程热物理

动力机械及工程

流体机械及工程

核燃料循环与材料

辐射防护及环境保护

电工理论与新技术

电力系统及自动化

高电压与绝缘技术

电力电子与电力传动

微电子学与固体电子学

信息与通信工程

通信与信息系统

信号与信息处理

自动化与计算机技术

控制科学与工程

控制理论与控制工程

检测技术与自动化装置

计算机科学与技术

计算机系统结构

计算机软件与理论

计算机应用技术

合成树脂塑料工业

轻工技术与工程

纺织科学与工程

纺织材料与纺织品设计

纺织化学与染整工程

服装设计与工程

食品科学与工程

粮食、油脂及植物蛋白工程

农产品加工及贮藏工程

水产品加工及贮藏工程

皮革化学与工程

建筑设计及理论

城市规划与设计

供热、供燃气、通风及空调工程

桥梁与隧道工程

水文学及水资源

水力学及河流动力学

道路与铁道工程

交通信息工程及控制

交通运输规划与管理

载运工具运用工程

船舶与海洋工程

船舶及航道工程

港口、海岸及近海工程

航空宇航科学技术

航空宇航推进理论与工程

航空宇航制造工程

人机与环境工程

环境科学与工程

概率论与数理统计

运筹学与控制论

一般力学与力学基础

热学与物质分子运动论

原子与分子物理

粒子物理与原子核物理

测绘科学与技术

大地测量学与测量工程

摄影测量与遥感

地图制图学与地理信息工程

固体地球物理学

大气科学及气象学

大气物理学与大气环境

古生物学与地层学

职业技术教育学

国际共产主义运动

宪法学与行政法学

环境与资源保护法学

马克思主义哲学

发展与教育心理学

考古学及博物馆学

时间限定

时间：

更新时间：

期刊范围

全部期刊核心期刊 EI来源期刊 SCI来源期刊 CAS来源期刊 CSCD来源期刊 CSSCI来源期刊

学科限定全选

强化学习算法: 作品数：313被引量：809H指数：13; 导出分析报告; 相关领域：自动化与计算机技术更多>>; 相关作者：俞扬周志华钱丽萍黄亮吴远更多>>; 相关机构：东南大学北京邮电大学清华大学电子科技大学更多>>; 相关期刊：更多>>; 相关基金：国家自然科学基金中央高校基本科研业务费专项资金国家重点基础研究发展计划国家高技术研究发展计划更多>>

在结果中检索

检索结果分析

选择条件：

期刊=计算机应用研究

共条记录，以下是1-9

全选清除导出

参考文献引证文献引用追踪

视图：

排序：

未知环境下基于突变定位SAC算法的移动机器人路径规划: 《计算机应用研究》2025年第2期455-461,共7页胡立坤韦春有; 广西科技计划资助项目(桂科AB21220039)。; 针对缺乏完整环境信息的条件下移动机器人局部路径规划算法性能提升及深度强化学习智能体训练速度慢的问题,提出了突变定位算法和改进的soft actor-critic(SAC)算法,并将两者结合为突变定位SAC算法。突变定位算法能够在缺乏完备环境信...; 关键词：移动机器人路径规划深度强化学习算法 SAC算法激光雷达未知环境

求解外卖配送问题的深度强化学习算法: 《计算机应用研究》2025年第1期205-213,共9页张旭阳刘勇马良; 教育部人文社会科学研究青年基金资助项目(21YJC630087)。; 以最小化骑手费用效益比为优化目标,采用最小比率旅行商问题对外卖配送问题进行建模。针对目前算法在求解该问题时计算精度低、算法稳定性差等问题,设计一种基于深度强化学习的DRL-MFA算法。首先,定义外卖配送问题的马尔可夫决策模型来...; 关键词：外卖配送问题最小比率旅行商问题深度强化学习多特征嵌入注意力机制

一种基于梯度的多智能体元深度强化学习算法被引量：1: 《计算机应用研究》2024年第5期1356-1361,共6页赵春宇赖俊陈希亮张人文; 国家自然科学基金资助项目(61806221)。; 多智能体系统在自动驾驶、智能物流、医疗协同等多个领域中广泛应用,然而由于技术进步和系统需求的增加,这些系统面临着规模庞大、复杂度高等挑战,常出现训练效率低和适应能力差等问题。为了解决这些问题,将基于梯度的元学习方法扩展到...; 关键词：元学习深度强化学习梯度下降多智能体深度强化学习

带平衡约束矩形布局优化问题的深度强化学习算法被引量：2: 《计算机应用研究》2022年第1期146-150,共5页徐义春万书振董方敏; 国家自然科学基金—新疆联合基金资助项目(U1703261)。; 带平衡约束的矩形布局问题源于卫星舱设备布局设计,属于组合优化问题。深度强化学习利用奖赏机制,通过数据训练实现高性能决策优化。针对布局优化问题,提出一种基于深度强化学习的新算法DAR及其扩展算法IDAR。DAR用指针网络输出定位顺序...; 关键词：布局优化问题指针网络强化学习深度学习

双Q网络学习的迁移强化学习算法被引量：5: 《计算机应用研究》2021年第6期1699-1703,共5页曾睿周建刘满禄张俊俊陈卓; 国家“十三五”核能开发项目(20161295);国家科技重大专项资助项目(2019ZX06002022)。; 深度强化学习在训练过程中会探索大量环境样本,造成算法收敛时间过长,而重用或传输来自先前任务(源任务)学习的知识,对算法在新任务(目标任务)的学习具有提高算法收敛速度的潜力。为了提高算法学习效率,提出一种双Q网络学习的迁移强化...; 关键词：深度强化学习双Q网络学习 actor-critic框架迁移学习

大型数据库中利用强化学习改进treap的关联规则挖掘算法被引量：12: 《计算机应用研究》2021年第1期88-92,共5页辛春花郭艳光鲁晓波; 国家自然科学基金资助项目(31660602,31660701,31960361);内蒙古自然科学基金资助项目(2017BS403);内蒙古自治区高等学校科学研究项目(NJZY20055)。; 信息的爆炸式增长使数据挖掘分析过程更加困难,针对普通关联规则挖掘算法很难在短运行时间和低关联度的前提下完成大型数据库中变量关系的评估和发现的问题,提出利用强化学习算法改进treap的大型数据库关联规则挖掘算法。提出的算法首...; 关键词：改进型treap算法强化学习算法大型数据库优先模型关联规则

基于出租车司机经验的约束深度强化学习算法路径挖掘被引量：6: 《计算机应用研究》2020年第5期1298-1302,共5页黄敏毛锋钱宇翔; 国家自然科学基金资助项目(U1611461,11574407);广东省科技计划项目(2016A020223006);中央高校基本科研业务费专项资金资助项目(17lgjc42)。; 利用出租车司机经验,提出约束深度强化学习算法(CDRL)在线计算不同时间段内OD间最快路线。首先描述了路段经验数据库(ERSD)的提取;然后介绍了CDRL方法,包括可选择约束路段生成和深度Q-lear-ning算法两个阶段,在第一阶段,生成OD(起终点)...; 关键词：最快路径挖掘路段经验数据库经验学习深度强化学习

基于RBF神经网络和强化学习算法的供应链产销协同计划冲突消解研究被引量：5: 《计算机应用研究》2015年第5期1335-1338,1344,共5页武玉英李豪蒋国瑞; 国家自然科学基金面上资助项目(71371018);北京市社科规划项目(13JDJGB037); 为提高传统协商自学习能力,利用多agent智能技术,建立基于黑板模型的协商框架,构建五元组协商模型,采取Q-强化学习算法,给出一种协商策略;使用RBF神经网络进一步优化协商策略,预测对手信息并调整让步幅度。通过算例验证该方法的可行性...; 关键词：多AGENT 自学习 RBF神经网络 Q-强化学习冲突消解

一种新的基于蚁群优化的模糊强化学习算法被引量：2: 《计算机应用研究》2011年第4期1266-1268,1271,共4页谢光强陈学松; 模糊Sarsa学习(FSL)是基于Sarsa学习而提出的一种模糊强化学习算法,它是一种通过在线策略来逼近动作值函数的算法,其每条模糊规则中,动作的选择是按照Softmax公式选择下一个动作。对于连续空间的复杂学习任务,FSL不能较好平衡探索和利...; 关键词：强化学习模糊Sarsa学习蚁群优化

全选清除导出

共1页<1>

检索报告对象比较聚类工具使用帮助返回顶部

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

强化学习算法

检索结果分析

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

强化学习算法

检索结果分析

下载全文

用户登录

高级检索检索式检索