-

检索结果分析

结果分析中...
检索条件:"关键词=无模型强化学习 "
条 记 录,以下是1-5
视图:
排序:
显示条数:
模型强化学习研究综述被引量:32
《计算机科学》2021年第3期180-187,共8页秦智慧 李宁 刘晓彤 刘秀磊 佟强 刘旭红 
国家重点研发计划(2018YFC0830202);北京信息科技大学“勤信人才”培育计划项目(2020);北京信息科技大学促进高校内涵发展——信息+项目-面向大数据的竞争情报分析关键技术研究;北京市教育委员会科技计划一般项目(KM202111232003);北京市自然基金(4204100)。
强化学习(Reinforcement Learning,RL)作为机器学习领域中与监督学习监督学习并列的第三种学习范式,通过与环境进行交互来学习,最终将累积收益最大化。常用的强化学习算法分为模型强化学习(Model-based Reinforcement Lear-ning)...
关键词:人工智能 强化学习 深度强化学习 模型强化学习 马尔可夫决策过程 
智能电网中的网络攻击检测机制的研究被引量:1
《网络安全技术与应用》2020年第6期28-29,共2页马晓杰 程晓荣 
本文首先分析了智能电网数据通信中的挑战,然后对智能电网中混合式和隐身网络攻击的实时检测以及基于模型强化学习(RL)框架的在线检测算法等一些网络攻击检测机制进行了研究。为了探究检测机制中提高安全性的工作方案,本文对现有网络...
关键词:智能电网 卡尔曼滤波器 模型强化学习 网络攻击 
基于时序差分学习的充电站有序充电方法被引量:11
《电力工程技术》2021年第1期181-187,共7页江明 许庆强 季振亚 
江苏省自然科学青年基金资助项目(BK20190710)。
电动汽车有序充电是智能用电领域的重要议题。传统的模型驱动方法需对充电行为建模,但受相关参数的强随机性等影响,相关模型不能完全反映充电行为的不确定性。考虑到数据驱动下的模型强化学习(MFRL)具有不依赖先验建模、适应强非线性...
关键词:电动汽车 有序充电 模型强化学习 数据驱动方法 马尔可夫决策过程(MDP) 
强化学习及其在机器人任务规划中的进展与分析被引量:3
《模式识别与人工智能》2023年第10期902-917,共16页张晓明 高士杰 姚昌瑀 褚誉 彭硕 
安徽省自然科学基金项目(No.2208085MF174);教育部中国高校产学研创新基金项目(No.2021ZYA06004)资助。
强化学习可以让机器人通过与环境的交互,学习最优的行动策略,是目前机器人领域关注的重要前沿方向之一.文中简述机器人任务规划问题的形式化建模,分析强化学习的主要方法,分别介绍模型强化学习、基于模型强化学习和分层强化学习的...
关键词:机器人 任务规划 强化学习 模型强化学习 基于模型强化学习 分层强化学习 
潜在空间中的策略搜索强化学习方法
《计算机科学与探索》2024年第4期1032-1046,共15页赵婷婷 王莹 孙威 陈亚瑞 王嫄 杨巨成 
国家自然科学基金(61976156);天津市企业科技特派员项目(20YDTPJC00560)。
策略搜索是深度强化学习领域中一种能够解决大规模连续状态空间和动作空间问题的高效学习方法,被广泛应用在现实问题中。然而,此类方法通常需要花费大量的学习样本和训练时间,且泛化能力较差,学到的策略模型难以泛化至环境中看似微小的...
关键词:模型强化学习 策略模型 状态表示 动作表示 连续动作空间 策略搜索强化学习方法 
检索报告 对象比较 聚类工具 使用帮助 返回顶部