肖飞

作品数:9被引量:56H指数:4
导出分析报告
供职机构:苏州大学更多>>
发文主题:函数逼近QRBF网络值函数药物发现更多>>
发文领域:自动化与计算机技术文化科学生物学理学更多>>
发文期刊:《通信学报》《科技创新导报》《饮食科学》《计算机研究与发展》更多>>
所获基金:江苏省自然科学基金国家自然科学基金江苏省高校自然科学研究项目教育部重点实验室开放基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-9
视图:
排序:
跨课程PBL教学法在化学小分子设计和优化平台开发中的应用被引量:1
《广东化工》2021年第24期263-264,246,共3页胡广 肖飞 
教育部产学合作协同育人项目(202102448005);江苏高校优势学科建设工程。
在后基因组时代背景下,计算机辅助药物发现在现代药物研发中体现越来越重要的作用。它不仅仅是交叉理论学科,涉及到计算机、生物、化工等学科的内容,更具有很强的实践性。因此,本教改论文探讨如何在生物信息学本科专业开展PBL教学,以一...
关键词:计算机辅助药物发现 PBL教学 跨课程 生物信息学 药物设计平台开发 
PBL教学法在《计算机辅助药物发现》教学中的实践探索被引量:2
《科技创新导报》2019年第29期180-181,183,共3页肖飞 刘鑫 
在后基因组时代背景下,计算机辅助药物发现在现代药物研发中体现越来越重要的作用。它不仅仅是交叉理论学科,更有很强的实践性。因此,在生物信息学本科专业开展PBL教学,通过实验流程设计将教学任务从理论和实践两个层面进行模块化融合,...
关键词:计算机辅助药物发现 PBL教学 项目式教学 生物信息学 
深度学习方法在生物质谱及蛋白质组学中的应用被引量:1
《饮食科学》2019年第10期98-98,100,共2页肖飞 
机器学习领域中比较好的学习方式就是深度学习,而机器领域中语音识别、自然语言处理、自动驾驶等方面取得了突破性的进展。而生物质谱作为当今研究生命科学领域中的研究工具,其代谢组学、生物制药等相关领域在生命科学领域研究中发挥着...
关键词:生物质谱 蛋白质组学 深度学习 应用 
基于自适应归一化RBF网络的Q-V值函数协同逼近模型被引量:9
《计算机学报》2015年第7期1386-1396,共11页刘全 肖飞 傅启明 伏玉琛 周小科 朱斐 
国家自然科学基金(61272005;61070223;61103045;61070122;61472262);江苏省自然科学基金(BK2012616);吉林大学符号计算与知识工程教育部重点实验室资助项目(93K172012K04)资助~~
径向基函数网络逼近模型可以有效地解决连续状态空间强化学习问题.然而,强化学习的在线特性决定了RBF网络逼近模型会面临"灾难性扰动",即新样本作用于学习模型后非常容易对先前学习到的输入输出映射关系产生破坏.针对RBF网络逼近模型的...
关键词:强化学习 函数逼近 径向基函数 灾难性扰动 协同逼近 
一种批量最小二乘策略迭代方法被引量:9
《计算机科学》2014年第9期232-238,共7页周鑫 刘全 傅启明 肖飞 
国家自然科学基金项目(61070223;61103045;61070122;61272005;61303108);江苏省自然科学基金(BK2012616);江苏省高校自然科学研究项目(09KJA520002;09KJB520012;13KJB520020);吉林大学符号计算与知识工程教育部重点实验室资助项目(93K172012K04)资助
策略迭代是一种迭代地评估和改进控制策略的强化学习方法。采用最小二乘的策略评估方法可以从经验数据中提取出更多有用信息,提高数据有效性。针对在线的最小二乘策略迭代方法对样本数据的利用不充分、每个样本仅使用一次就被丢弃的问题...
关键词:强化学习 批量更新 最小二乘 策略迭代 
一种基于线性函数逼近的离策略Q(λ)算法被引量:26
《计算机学报》2014年第3期677-686,共10页傅启明 刘全 王辉 肖飞 于俊 李娇 
国家自然科学基金(60873116;61070223;61103045);江苏省自然科学基金(BK2008161;BK2009116);江苏省高校自然科学研究项目(09KJA520002;09KJB520012);吉林大学符号计算与知识工程教育部重点实验室资助项目(93K172012K04)资助~~
将函数逼近用于强化学习是目前机器学习领域的一个新的研究热点.针对传统的基于查询表及函数逼近的Q(λ)学习算法在大规模状态空间中收敛速度慢或者无法收敛的问题,提出一种基于线性函数逼近的离策略Q(λ)算法.该算法通过引入重要性关...
关键词:强化学习 函数逼近 离策略 Q(A)算法 机器学习中图法 
一种优先级扫描的Dyna结构优化算法被引量:2
《计算机研究与发展》2013年第10期2176-2184,共9页孙洪坤 刘全 傅启明 肖飞 高龙 
国家自然科学基金项目(61070223;61103045;61272005;61272244);江苏省自然科学基金项目(BK2012616);江苏省高校自然科学研究项目(09KJA520002;09KJB520012);吉林大学符号计算与知识工程教育部重点实验室基金项目(93K172012K04)
不确定环境的时序决策问题是强化学习研究的主要内容之一,agent的目标是最大化其与环境交互过程中获得的累计奖赏值.直接学习方法寻找最优策略的算法收敛效率较差,而采用Dyna结构将学习与规划并行集成,可提高算法的收敛效率.为了进一步...
关键词:强化学习 时序决策 优先级扫描 Dyna结构 Dyna—PS 
基于多Agent并行采样和学习经验复用的E^3算法被引量:2
《吉林大学学报(工学版)》2013年第1期135-140,共6页刘全 杨旭东 荆玲 肖飞 
国家自然科学基金项目(61070223;61103045;60970015;61170020;61272005);江苏省自然科学基金项目(BK2009116;BK2012616);江苏省高校自然科学研究项目(09KJA520002;09KJB520012);吉林大学符号计算与知识工程教育部重点实验室项目(93K172012K04)
针对E3算法所需的收敛时间界限太大,在实际问题中难以有效应用的问题,提出了一种基于多Agent并行采样和学习经验复用的改进算法。该算法在探索阶段,通过多Agent并行采样,快速收集模型信息,加速了模型构建过程;在利用阶段,通过保留最优...
关键词:人工智能 强化学习 E3算法 多AGENT 并行采样 学习经验复用 
基于自适应势函数塑造奖赏机制的梯度下降Sarsa(λ)算法被引量:6
《通信学报》2013年第1期77-88,共12页肖飞 刘全 傅启明 孙洪坤 高龙 
国家自然科学基金资助项目(61070223;61103045;61070122;61272005);江苏省自然科学基金资助项目(BK2012616);江苏省高校自然科学研究基金资助项目(09KJA520002;09KJB520012);吉林大学符号计算与知识工程教育部重点实验室基金资助项目(93K172012K04)~~
针对连续状态空间下的强化学习算法初始性能差及收敛速度慢的问题,提出利用自适应势函数塑造奖赏机制来改进强化学习算法。该机制通过额外的奖赏信号自适应地将模型知识传递给学习器,可以有效提高算法的初始性能及收敛速度。鉴于径向基...
关键词:强化学习 Sarsa(λ) 梯度下降 势函数 塑造奖赏 
检索报告 对象比较 聚类工具 使用帮助 返回顶部