云南高校图书馆联盟文献共享服务平台- 检索结果

-

在结果中检索

检索结果分析

检索条件："关键词=无模型强化学习 "

共条记录，以下是1-5

发文量、被引量趋势图

全选清除导出

参考文献引证文献引用追踪

视图：

排序：

显示条数：

无模型强化学习研究综述被引量：32: 《计算机科学》2021年第3期180-187,共8页秦智慧李宁刘晓彤刘秀磊佟强刘旭红; 国家重点研发计划(2018YFC0830202);北京信息科技大学“勤信人才”培育计划项目(2020);北京信息科技大学促进高校内涵发展——信息+项目-面向大数据的竞争情报分析关键技术研究;北京市教育委员会科技计划一般项目(KM202111232003);北京市自然基金(4204100)。; 强化学习(Reinforcement Learning,RL)作为机器学习领域中与监督学习、无监督学习并列的第三种学习范式,通过与环境进行交互来学习,最终将累积收益最大化。常用的强化学习算法分为模型化强化学习(Model-based Reinforcement Lear-ning)...; 关键词：人工智能强化学习深度强化学习无模型强化学习马尔可夫决策过程

智能电网中的网络攻击检测机制的研究被引量：1: 《网络安全技术与应用》2020年第6期28-29,共2页马晓杰程晓荣; 本文首先分析了智能电网数据通信中的挑战,然后对智能电网中混合式和隐身网络攻击的实时检测以及基于无模型强化学习(RL)框架的在线检测算法等一些网络攻击检测机制进行了研究。为了探究检测机制中提高安全性的工作方案,本文对现有网络...; 关键词：智能电网卡尔曼滤波器无模型强化学习网络攻击

基于时序差分学习的充电站有序充电方法被引量：11: 《电力工程技术》2021年第1期181-187,共7页江明许庆强季振亚; 江苏省自然科学青年基金资助项目(BK20190710)。; 电动汽车有序充电是智能用电领域的重要议题。传统的模型驱动方法需对充电行为建模,但受相关参数的强随机性等影响,相关模型不能完全反映充电行为的不确定性。考虑到数据驱动下的无模型强化学习(MFRL)具有不依赖先验建模、适应强非线性...; 关键词：电动汽车有序充电无模型强化学习数据驱动方法马尔可夫决策过程(MDP)

强化学习及其在机器人任务规划中的进展与分析被引量：3: 《模式识别与人工智能》2023年第10期902-917,共16页张晓明高士杰姚昌瑀褚誉彭硕; 安徽省自然科学基金项目(No.2208085MF174);教育部中国高校产学研创新基金项目(No.2021ZYA06004)资助。; 强化学习可以让机器人通过与环境的交互,学习最优的行动策略,是目前机器人领域关注的重要前沿方向之一.文中简述机器人任务规划问题的形式化建模,分析强化学习的主要方法,分别介绍无模型强化学习、基于模型的强化学习和分层强化学习的...; 关键词：机器人任务规划强化学习无模型强化学习基于模型的强化学习分层强化学习

潜在空间中的策略搜索强化学习方法: 《计算机科学与探索》2024年第4期1032-1046,共15页赵婷婷王莹孙威陈亚瑞王嫄杨巨成; 国家自然科学基金(61976156);天津市企业科技特派员项目(20YDTPJC00560)。; 策略搜索是深度强化学习领域中一种能够解决大规模连续状态空间和动作空间问题的高效学习方法,被广泛应用在现实问题中。然而,此类方法通常需要花费大量的学习样本和训练时间,且泛化能力较差,学到的策略模型难以泛化至环境中看似微小的...; 关键词：无模型强化学习策略模型状态表示动作表示连续动作空间策略搜索强化学习方法

全选清除导出

共1页<1>

检索报告对象比较聚类工具使用帮助返回顶部