强化学习算法

作品数:313被引量:809H指数:13
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:俞扬周志华钱丽萍黄亮吴远更多>>
相关机构:东南大学北京邮电大学清华大学电子科技大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金中央高校基本科研业务费专项资金国家重点基础研究发展计划国家高技术研究发展计划更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机测量与控制x
条 记 录,以下是1-5
视图:
排序:
基于强化学习算法的神经网络模糊测试技术优化研究
《计算机测量与控制》2024年第3期131-137,共7页张宇豪 关昕 
现有神经网络模糊测试技术在测试样本生成阶段通常对初始样本进行随机变异,导致生成样本质量不高,从而测试覆盖率不高;针对以上问题,提出一种基于强化学习算法的神经网络模糊测试技术,将模糊测试过程建模为马尔可夫决策过程,在该模型中...
关键词:模糊测试 神经网络 强化学习 马尔科夫决策过程 奖励函数 
基于D-DQN强化学习算法的双足机器人智能控制研究
《计算机测量与控制》2024年第3期181-187,共7页李丽霞 陈艳 
2022年度广州华商学院高等教育教学改革项目(HS2022ZLGC71)。
针对现有双足机器人智能控制算法存在的轨迹偏差大、效率低等问题,提出了一种基于D-DQN强化学习的控制算法;先分析双足机器人运动中的坐标变换关系和关节连杆补偿过程,然后基于Q值网络实现对复杂运动非线性过程降维处理,采用了Q值网络...
关键词:D-DQN 强化学习 双足机器人 智能控制 经验回放池 虚拟约束控制 
基于一维卷积循环神经网络的深度强化学习算法被引量:8
《计算机测量与控制》2022年第1期258-265,共8页畅鑫 李艳斌 田淼 陈苏逸 杜宇峰 赵研 
中国博士后科学基金(2021M693002)。
针对现有深度强化学习算法在状态空间维度大的环境中难以收敛的问题,提出了在时间维度上提取特征的基于一维卷积循环网络的强化学习算法;首先在深度Q网络(DQN,deep Q network)的基础上构建一个深度强化学习系统;然后在深度循环Q网络(DRQ...
关键词:强化学习 深度学习 长短时记忆网络 卷积神经网络 深度Q网络 
基于内在动机的强化学习算法在两轮机器人中的研究
《计算机测量与控制》2015年第9期3185-3187,3191,共4页任红格 向迎帆 李福进 刘伟民 
国家自然科学基金(61203343);河北省自然基金(E2014209106)
针对两轮自平衡机器人在学习过程中遇到的主动性差和以往强化学习对单步学习效率低的问题,受心理学中内在动机理论的启发,提出一种基于内在动机的强化学习算法;该算法利用内在动机信号作为内部奖励,模拟人类心理认知机理并与外部信号一...
关键词:内在动机 强化学习 平衡控制 鲁棒性 两轮机器人 
基于时隙CSMA的水声无线传感器网络节能强化学习算法被引量:1
《计算机测量与控制》2014年第12期4035-4039,共5页周文刚 谭永杰 朱海 
国家自然科学基金项目(61103143);河南省科技厅自然科学研究计划项目(132300410276);河南省教育厅自然科学研究计划项目(2010B520036)
针对水声无线传感器网络的节能问题,提出了一种基于时隙CSMA的强化学习算法;该算法利用强化学习协议自适应水下环境,根据数据传输的距离调整发射功率,从而减少能量消耗,再结合时隙CSMA协议,使用随机退避算法减少信道中的数据碰撞,使得...
关键词:水声无线传感器网络 强化学习算法 时隙CSMA 节能 随机退避算法 
检索报告 对象比较 聚类工具 使用帮助 返回顶部