增强学习算法

作品数:20被引量:71H指数:5
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:刘惟一郭方铭张志坚连传强周星更多>>
相关机构:武汉理工大学云南大学国防科学技术大学东北师范大学更多>>
相关期刊:《计算机工程与设计》《地球科学》《集装箱化》《起重运输机械》更多>>
相关基金:国家自然科学基金国家教育部博士点基金中央高校基本科研业务费专项资金霍英东青年教师基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于支持向量机和增强学习算法的岩爆烈度等级预测被引量:12
《地球科学》2023年第5期2011-2023,共13页杨玲 魏静 
国家自然科学基金资助项目(No.42172291).
岩爆烈度等级的准确预测对减轻乃至消除岩爆危害具有重要意义.针对岩爆烈度等级预测模型特征选取模糊和预测准确度不高问题,提出了一种ReliefF-Pearson特征选择下基于SSA-SVM-AdaBoost算法的岩爆等级预测模型.结合ReliefF的权值思想和Pe...
关键词:岩爆烈度等级 特征选择 支持向量机 麻雀搜索算法 增强学习算法 工程地质. 
基于增强学习算法的微电网智能频率协调控制策略被引量:1
《东北电力技术》2023年第2期1-5,共5页姜展鹏 刘洋 刘守恒 郝立超 
辽宁省教育厅科学技术研究项目(LQGD2020001)。
随着清洁能源发电比例的增加,为了减轻微电网发电的随机性以及不确定性带来的影响,提高供电可靠性,对于微电网进行频率控制显得尤为重要。由于储能系统可以灵活存储或释放电能,利用增强学习算法的智能控制策略,调整光伏发电接入微电网...
关键词:增强学习 微电网 光伏发电 频率波动 
基于增强学习算法的云资源动态弹性伸缩
《信息技术》2021年第8期122-126,共5页张继东 曹靖城 周帅 
为解决云资源节点负载不均衡导致利用效率低、资源负载均衡性较差等问题,提出以增强学习算法改善云资源动态负载均衡弹性伸缩的方法。采用云资源动态特性基准分析云资源动态的最初基准,对云资源动态特性进行节点采样,设置云资源节点负...
关键词:增强学习算法 云资源 负载均衡 弹性收缩 动态基准 
联合支持向量机和增强学习算法的多波束声学底质分类被引量:5
《测绘学报》2021年第7期972-981,共10页纪雪 唐秋华 陈义兰 李杰 丁德秋 
国家自然科学基金(41876111);国家海洋局极地考察办公室项目(IRASCC2020-2022)。
基于多波束的声学底质分类是近年来快速发展起来的新型海底底质探测技术。针对多波束声学底质分类中底质类型多样化、类型之间差异较小等多分类难点问题,本文提出一种GA-SVM-AdaBoost算法。利用自适应性和全局搜索能力强的遗传算法(gene...
关键词:多波束测深系统 声学底质分类 支持向量机 遗传算法 ADABOOST算法 
基于增强学习算法的插电式燃料电池电动汽车能量管理控制策略被引量:12
《工程科学学报》2019年第10期1332-1341,共10页林歆悠 夏玉田 魏申申 
国家自然科学基金资助项目(51505086)
以一款插电式燃料电池电动汽车(plug-in fuel cell electric vehicle,PFCEV)为研究对象,为改善燃料电池氢气消耗和电池电量消耗之间的均衡,实现插电式燃料电池电动汽车的燃料电池与动力电池之间的最优能量分配,考虑燃料电池汽车实时能...
关键词:燃料电池 能量分配 电池电量 综合能耗 智能体 动力电池 
基于增强学习算法的AGV导航研究
《起重运输机械》2019年第12期40-45,共6页王翔 吴洪明 周星 
AGV(Automated Guided Vehicle)导航问题是一个连续状态空间问题,直接应用传统表格型增强学习方法存在维数灾难和学习效率低等问题。近年来,近似强化学习和策略梯度算法等增强学习方法的提出和改进为有效解决维数灾难和泛化问题以及AGV...
关键词:增强学习算法 AGV导航 马尔可夫决策 MATLAB仿真 
增强学习算法在集装箱船舶配载问题上的应用被引量:1
《集装箱化》2018年第1期13-17,共5页严翀宇 王男男 沈一帆 
集装箱船舶配载是集装箱码头生产作业的重要环节之一,其直接影响码头整体装卸作业效率.目前,我国集装箱码头主要采用传统在线搜索算法解决集装箱船舶配载问题,但此类方法在求解大规模算例时效率较低.
关键词:集装箱码头 船舶配载 学习算法 应用 线搜索算法 生产作业 装卸作业 
基于状态聚类的非参数化近似广义策略迭代增强学习算法被引量:1
《控制与决策》2017年第12期2153-2161,共9页季挺 张华 
国家863计划项目(SS2013AA041003)
为解决当前近似策略迭代增强学习算法普遍存在计算量大、基函数不能完全自动构建的问题,提出一种基于状态聚类的非参数化近似广义策略迭代增强学习算法(NPAGPI-SC).该算法利用二级随机采样过程采集样本,利用trial-and-error过程和以样...
关键词:增强学习 策略迭代 非参数化 状态聚类 
增强学习算法寻找最优策略分析被引量:1
《电子技术与软件工程》2017年第4期183-183,共1页孙灿宇 
如今人工智能发展迅速,在日常生活中越来越普及,与人工智能接触的机会越来越多。本文介绍了增强学习中的Q学习中如何找到最优策略以达到最终状态的过程和总结,以及通过试验对影响Q值的几个因素的进行了分析。
关键词:Q-LEARNING 策略 探索 Q值 状态 
基于自适应探索改进的深度增强学习算法被引量:2
《微电子学与计算机》2016年第6期139-142,共4页毛坚桓 殷璐嘉 
针对深度增强学习算法中探索开发策略的平衡问题,提出一种基于VDBE(Value-Difference Based Exploration)扩展的自适应探索改进算法.该算法依赖于值函数差异提出一种基于状态的探索控制策略,以达到在初始学习阶段不熟悉周围环境时agent...
关键词:深度增强学习 探索/开发平衡 VDBE 自适应控制 
检索报告 对象比较 聚类工具 使用帮助 返回顶部