云南高校图书馆联盟文献共享服务平台- PPO

PPO: 作品数：739被引量：3717H指数：24; 导出分析报告; 相关领域：农业科学轻工技术与工程更多>>; 相关作者：何中虎夏先春赵光远张骥红马传喜更多>>; 相关机构：中国科学院西北农林科技大学安徽农业大学福建农林大学更多>>; 相关期刊：更多>>; 相关基金：国家自然科学基金国家科技支撑计划国家高技术研究发展计划国家重点基础研究发展计划更多>>

基于PPO算法的逻辑综合序列优化通用框架设计: 《宁波大学学报(理工版)》2025年第2期78-85,共8页王梦可杨朝晖查晓婧夏银水; 国家自然科学基金(62131010,U22A2013);国家自然科学基金青年项目(62304115);浙江省自然科学基金创新群体课题(LDT23F04021F04);浙江省科研计划一般项目(Y202248965).; 逻辑综合通常采用启发式方法将逻辑优化算法组成为序列进行电路性能优化,而启发式方法难以根据电路和优化目标的差异进行序列自动化调节,影响了电路优化质量.为了在集成电路设计中提升序列的自适应生成能力,将序列优化问题建模为马尔可...; 关键词：逻辑综合序列优化强化学习近端策略优化

Active Object Detection Based on PPO Learning Algorithm with Decision Knowledge Guidance: 《Machine Intelligence Research》2025年第2期386-396,共11页Fujing Yao Guohui Tian Yuhao Wang Ning Yang; supported in part by the National Natural Science Foundation of China(Nos.62273203 and U1813215);in part by the Special Fund for the Taishan Scholars Program of Shandong Province,China(No.ts2015110005).; After detecting a target object,a service robot must approach the target object to perform the associated service task.In active object detection(AOD)tasks,effective feature information representation and comprehensiv...; 关键词：Service robot active object detection reinforcement learning path experience comprehensive decision model

基于YOLO和PPO的无人机路径规划: 《计算机与现代化》2025年第4期50-55,62,共7页张慧玉刘磊闫冬梅梁成庆; 河北省自然科学基金资助项目(A2023209002);安徽省重点实验室基金资助项目(KLAHEI18018);教育部重点实验室开放基金资助项目(Scip20240111)。; 针对复杂多变的三维未知环境,设计一种基于深度强化学习的无人机路径规划方法,该方法在有限的观测状态下作出决策,解决高复杂度和不确定性带来的挑战。首先,在有限的感知范围内,利用YOLO网络提取图像中的障碍物信息;其次,提出危险度来...; 关键词：无人机路径规划深度强化学习 YOLOv4

基于深度强化学习的铁路线路方案生成方法研究: 《自动化技术与应用》2025年第3期21-24,155,共5页祖家伟王明生吕希奎; 河北省自然基金(E2021210027)。; 为解决铁路线路方案初步设计阶段的短时需求,结合深度强化学习理论提出智能生成线路方案方法。通过简化地形建立强化学习环境模型,以选线设计工作经验设置智能体探索状态与动作,关联铁路选线任务设立奖惩反馈,搭建PPO框架寻优并输出线...; 关键词：智能选线深度强化学习 PPO 线路走向线形拟合

自适应奖励函数的PPO曲面覆盖方法: 《计算机工程》2025年第3期86-94,共9页李淑怡阳波陈灵沈玲唐文胜; 国家自然科学基金青年项目(62203167)。; 针对机器人清洁作业过程中现有曲面覆盖方法难以适应曲面变化且覆盖效率低的问题,提出一种自适应奖励函数的近端策略优化(PPO)曲面覆盖方法(SC-SRPPO)。首先,将目标曲面离散化,以球查询方式获得协方差矩阵,求解点云的法向量,建立3D曲面...; 关键词：清洁机器人曲面覆盖路径规划强化学习近端策略优化

SEBS-g-MAH对PPO/PA66复合材料性能和形貌的影响: 《中国塑料》2025年第3期30-35,共6页杨青林周松李璨然余闻达罗玉梅; 采用马来酸酐接枝苯乙烯-乙烯-丁烯-苯乙烯共聚物(SEBS-g-MAH)改性,用双螺杆挤出和注射成型制备了增韧的聚苯醚/聚酰胺66(PPO/PA66)复合材料,测试了材料吸水率、力学和熔体流动性能,用差示扫描量热法研究了结晶行为,用扫描电子显微镜观...; 关键词：聚苯醚聚酰胺66 马来酸酐接枝苯乙烯-乙烯-丁烯-苯乙烯共聚物力学性能吸水率结晶性能

基于卷积金字塔网络的PPO算法求解作业车间调度问题: 《现代制造工程》2025年第3期19-30,共12页徐帅李艳武谢辉牛晓伟; 国家自然科学基金面上项目(12175194);重庆市教委科学技术研究项目(KJQN202301216,KJQN202001224)。; 作业车间调度问题是一个经典的NP-hard组合优化问题,其调度方案的优劣直接影响制造系统的运行效率。为得到更优的调度策略,以最小化最大完工时间为优化目标,提出了一种基于近端策略优化(Proximal Policy Optimization,PPO)和卷积神经网...; 关键词：深度强化学习作业车间调度卷积神经网络近端策略优化空间金字塔池化

RIS Enabled Simultaneous Transmission and Key Generation with PPO:Exploring Security Boundary of RIS Phase Shift: 《ZTE Communications》2025年第1期11-17,共7页FAN Kaiqing YAO Yuze GAO Ning LI Xiao JIN Shi; supported in part by the National Science Foundation of China(NSFC)under Grant No.62371131;in part by the National Key R&D Program of China under Grant No.2024YFE0200700;in part by the program of Zhishan Young Scholar of Southeast University under Grant No.2242024RCB0030。; Due to the broadcast nature of wireless channels and the development of quantum computers,the confidentiality of wireless communication is seriously threatened.In this paper,we propose an integrated communications and...; 关键词：reconfigurable intelligent surfaces physical layer key generation integrated communications and security one-time pad deep reinforcement learning

基于MDE-PPO算法的配电网多时间尺度无功优化: 《电气自动化》2025年第1期79-81,85,共4页尹力盛俊杰杨帆袁杰朱陶之冯燕钧; 国家电网有限公司科技项目(5400-202322566A-3-2-ZN)。; 考虑配电网不同设备动作特性,提出了一种多时间尺度无功优化策略。首先,建立计及分布式能源的配电网无功优化模型以降低网络损耗与电压偏移;其次,将短时间尺度决策问题建立为马尔科夫决策过程以便深度强化学习算法的优化训练;然后,提出...; 关键词：配电网深度强化学习改进差分进化近端策略优化多时间尺度无功优化

嗅觉障碍意见书2023版(PPOD-23)解读: 《中华耳鼻咽喉头颈外科杂志》2025年第2期212-216,共5页陈敬国陈春燕祝康任晓勇李华斌; 陕西省重点研发计划项目(2024SF-YBXM-345);中央高校基本科研业务费资助项目(xzy012020046);陕西省自然科学基金研究计划青年项目(2021JQ-418)。; 2023年10月,嗅觉障碍意见书2023版(Position Paper on Olfactory Dysfunction 2023,PPOD-23)在鼻科学顶级期刊Rhinology杂志上线发表。PPOD-23全文长达116页,引用文献724篇,是新型冠状病毒感染(COVID-19)疫情暴发以来最全面的嗅觉障碍...; 关键词：嗅觉障碍临床实践鼻科学引用文献意见书 PPO

PPO