胡智慧

作品数:4被引量:26H指数:3
导出分析报告
供职机构:苏州大学计算机科学与技术学院更多>>
发文主题:B/S架构基于B/S架构课程管理培训部ASP.NET更多>>
发文领域:自动化与计算机技术医药卫生更多>>
发文期刊:《通信学报》《中国医疗设备》《计算机学报》《软件》更多>>
所获基金:苏州市科技计划项目(应用基础研究计划)国家自然科学基金教育部重点实验室开放基金江苏高校优势学科建设工程资助项目更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-4
视图:
排序:
带最大熵修正的行动者评论家算法被引量:6
《计算机学报》2020年第10期1897-1908,共12页姜玉斌 刘全 胡智慧 
国家自然科学基金项目(61772355,61702055,61472262,61502323,61502329);江苏省高等学校自然科学研究重大项目(18KJA520011,17KJA520004);吉林大学符号计算与知识工程教育部重点实验室资助项目(93K172014K04,93K172017K18);苏州市应用基础研究计划工业部分(SYG201422);江苏高校优势学科建设工程资助项目资助.
在行动者评论家算法中,策略梯度通常使用最大熵正则项来提高行动策略的随机性以保证探索.策略的随机使Agent能够遍历所有动作,但是会造成值函数的低估并影响算法的收敛速度与稳定性.针对策略梯度中最大熵正则项带来的低估问题,提出最大...
关键词:强化学习 深度学习 行动者评论家算法 最大熵 策略梯度 
基于重要性采样的优势估计器
《通信学报》2019年第5期108-116,共9页刘全 姜玉斌 胡智慧 
国家自然科学基金资助项目(No.61772355;No.61702055;No.61472262;No.61502323;No.61502329);江苏省高等学校自然科学研究重大基金资助项目(No.18KJA520011;No.17KJA520004);吉林大学符号计算与知识工程教育部重点实验室基金资助项目(No.93K172014K04;No.93K172017K18);苏州市应用基础研究计划工业部分基金资助项目(No.SYG201422)~~
在连续动作任务中,深度强化学习通常采用高斯分布作为策略函数。针对高斯分布策略函数由于截断动作导致算法收敛速度变慢的问题,提出了一种重要性采样优势估计器(ISAE)。该估计器在通用优势估计器(GAE)的基础上,引入了重要性采样机制,...
关键词:强化学习 重要性采样 深度强化学习 优势函数 
仿真数字胃肠机的设计与实现被引量:3
《中国医疗设备》2016年第1期45-47,共3页胡智慧 朱钱成 胡俊峰 
中华医学会医学教育分会;中国高等教育学会医学教育专业委员会2012年度医学教育研究立项课题(2012-JS-58);江苏省现代教育技术研究课题(2012-R-22397);江苏省高等学校大学生实践创新训练计划项目(201310313008Z)
利用仿真技术开发仿真数字胃肠机,不仅可以完成真实数字胃肠机的各种功能,真实感强,而且无X线辐射,安全可靠。此装置还可以利用人体模型进行操作训练实践教学,使学生能够自主学习并完成相关操作。
关键词:仿真技术 数字胃肠机 临床教学 
基于B/S架构的培训部课程管理系统的设计与实现被引量:17
《软件》2015年第8期79-83,共5页胡智慧 朱斐 
随着各大学和中小学的培训部规模的扩大,培训部对课程的管理、师资的管理、学员的管理等都比以往有了更高的要求,传统的课程管理方式已难以满足培训部人员的需求。基于现代计算机网络技术的培训部课程管理系统则能满足当今培训部对业务...
关键词:ASP.NET B/S架构 课程管理 培训部 
检索报告 对象比较 聚类工具 使用帮助 返回顶部