模仿学习

作品数:578被引量:727H指数:12
导出分析报告
相关领域:文化科学更多>>
相关作者:阮晓钢于建均陈晋音肖晓晖黄攀峰更多>>
相关机构:北京工业大学哈尔滨工业大学中国科学院大学苏州大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家教育部博士点基金国家社会科学基金教育部人文社会科学研究基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于改进DMP的机械手模仿学习算法研究
《计算机技术与发展》2025年第4期141-148,共8页赵龙阳 谭昊民 张会兵 刘琦 
国家自然科学基金项目(62267003);广东省农业科学院协同创新中心项目(XTXM202203)。
动态运动原语(Dynamic Movement Primitives,DMP)算法是工业机械手中常见的模仿学习算法,当前DMP算法发展迅速,但是在能源消耗方面优化较少。针对国家绿色环保战略和企业用人用工成本等问题,提出了一种以减少能源消耗和机械手示教快速...
关键词:能源消耗 改进动态运动原语 拖动示教 关键点抓取 PyBullet仿真 
“立德树人”视域下低龄学生养成教育的思考与实践
《视周刊》2025年第6期141-141,共1页俞程 
武威市教育科学“十四五”规划2023年度一般课题研究成果,课题名称为《学校立德树人与养成教育有效融合的策略研究》,课题立项号:WW[2023]GH195。
随着我国教育改革的不断发展与实践,“立德树人”的观念逐渐加深,对于学生养成教育培养的要求越来越高。低龄时期学生的养成教育是非常重要的,学生这一时期思想性格发育还未完全,容易受到周围环境的影响,容易模仿学习身边人的行为理念...
关键词:养成教育 立德树人 模仿学习 思想性格 思考与实践 引领作用 行为理念 低龄 
商汤绝影发布“强化学习”端到端自动驾驶方案,上海车展将实现实车部署
《汽车与配件》2025年第6期65-67,共3页张颖 
商汤绝影发布了基于世界模型协同交互的端到端技术路线R-UniAD,这一技术路线从模仿学习发展到强化学习,预计将超越人类驾驶表现。商汤绝影将在上海车展上重磅发布R-UniAD的实车部署计划。春节前后,智能驾驶领域和人工智能行业都迎来了...
关键词:强化学习 技术普及 上海车展 模仿学习 人工智能 商汤 智能驾驶 比亚迪 
基于双缓冲区生成对抗模仿学习的电力系统实时安全约束经济调度
《电网技术》2025年第3期1121-1129,I0076-I0079,共13页李东颖 朱建全 陈一熙 
国家自然科学基金项目(51977081)。
随着新能源渗透率不断攀升,电力系统波动性和随机性日趋加剧,电网安全经济运行正面临着严峻挑战。为此,该文提出了一种基于改进生成对抗模仿学习算法的实时安全约束经济调度方法。首先,将新能源电力系统多时段安全约束经济调度问题建模...
关键词:安全约束经济调度 模仿学习 生成对抗网络 双缓冲机制 深度强化学习 
基于多模态大语言模型的低延迟端到端自动驾驶模型
《工业控制计算机》2025年第3期32-34,共3页金彦亮 顾晨杰 高塬 
上海大学协同创新项目基金(XTCX-KJ-2022-68)。
自动驾驶技术当前是科技领域的研究热点之一。针对当前自动驾驶领域中,端到端模型在可解释性和实时性之间无法权衡的问题,提出了一种基于多模态语言模型的低延迟端到端自动驾驶模型,利用多模态大语言模型对自动驾驶数据集进行决策原因...
关键词:自动驾驶 多模态大语言模型 模仿学习 多任务学习 
基于图神经网络和强化学习的柔性作业车间调度算法
《实验室研究与探索》2025年第2期101-109,共9页王亮 顾益铭 刘世亮 
同济大学“第十八期实验教学改革专项基金重点项目(1000104171)。
针对不同规模的柔性作业车间调度问题,提出一种基于图神经网络的深度强化学习算法(GRL)。该算法采用3个异构析取子图来表征车间状态,并利用图神经网络提取车间特征,构建相应的马尔可夫决策过程,使用模仿学习与强化学习相结合的联合训练...
关键词:强化学习 图神经网络 模仿学习 柔性作业车间调度 
父母情绪与孩子性格:一场微妙的互动之旅
《为了孩子(2-7岁)(下)》2025年第2期1-1,共1页钱辰璐 
奥地利心理学家阿尔弗雷德·阿德勒曾说:“幸运的人一生都被童年治愈,不幸的人一生都在治愈童年。”年幼的孩子就像一张白纸,有着无限的可塑性。在他们小小的世界里,父母无疑是最为亲近的存在,有着不容置疑的权威。父母的一言一行,都成...
关键词:模仿学习 阿尔弗雷德·阿德勒 情绪稳定 性格 可塑性 童年 奥地利 
基于改进深度强化学习算法的行为决策方法
《汽车实用技术》2025年第1期25-30,共6页贾瑞豪 
针对传统深度强化学习算法因训练时探索策略差导致在自动驾驶决策任务中同时出现行驶效率低、收敛慢和决策成功率低的问题,提出了结合专家评价的深度竞争双Q网络的决策方法。提出离线专家模型和在线模型,在两者间引入自适应平衡因子;引...
关键词:自动驾驶 行为决策 深度强化学习 模仿学习 改进DQN算法 
融合模仿学习的双足机器人全向行走步态生成方法
《电子科技》2025年第1期29-36,共8页冯振 牟海明 薛杰 李清都 
东方学者计划(TP2019064)。
由于双足机器人具有复杂的高维动力学和高度动态特性,因此难以实现全向步态。为了实现双足机器人全向行走,文中基于深度强化学习算法提出了一种融合模仿学习的双足机器人步态训练方法。根据专家经验和双足行走具有周期性的特点,设计了...
关键词:强化学习 模仿学习 专家经验 周期步态 全向运动 转向运动 对角线运动 双足机器人 
协会“极为特殊的伟大工程”会议会议纪要
《全面腐蚀控制》2025年第1期2-16,共15页
《现代腐蚀学—腐蚀控制模板》一书的面世,是我国乃至国际腐蚀与腐蚀控制界的一件具有里程碑式历史性意义的大事,是对该领域科技发展历史概况的回顾和总结,穷力开创“从根本上全面有效控制腐蚀新纪元”的展望。本书作者从认清腐蚀的本...
关键词:中国化学工业 一流水准 腐蚀控制 自立自强 模仿学习 我国化学工业 技术创新 最佳效益 
检索报告 对象比较 聚类工具 使用帮助 返回顶部