苏州大学计算机科学与技术学院江苏省计算机信息处理技术重点实验室

作品数:271被引量:1061H指数:15
导出分析报告
发文作者:刘勇国曹建葛运东余亚翔庄春梅更多>>
发文领域:自动化与计算机技术电子电信文化科学航空宇航科学技术更多>>
发文主题:自适应P2P图像分割粒子滤波网络更多>>
发文期刊:更多>>
所获基金:国家自然科学基金江苏省高校自然科学研究项目江苏省计算机信息处理技术重点实验室基金江苏省自然科学基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一机构
结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于策略蒸馏主仆框架的优势加权双行动者-评论家算法
《计算机科学》2024年第11期81-94,共14页杨皓麟 刘全 
国家自然科学基金(62376179,61772355,61702055,61876217,62176175);新疆维吾尔自治区自然科学基金(2022D01A238);江苏高校优势学科建设工程资助项目。
离线强化学习(Offline RL)定义了从固定批次的数据集中学习的任务,能够规避与环境交互的风险,提高学习的效率与稳定性。其中优势加权行动者-评论家算法提出了一种将样本高效动态规划与最大似然策略更新相结合的方法,在利用大量离线数据...
关键词:离线强化学习 深度强化学习 策略蒸馏 双行动者-评论家框架 经验回放机制 
基于不确定性权重的保守Q学习离线强化学习算法被引量:1
《计算机科学》2024年第9期265-272,共8页王天久 刘全 乌兰 
国家自然科学基金(61772355,61702055,61876217,62176175);新疆维吾尔自治区自然科学基金(2022D01A238);江苏高校优势学科建设工程资助项目。
离线强化学习(Offline RL)中,智能体不与环境交互而是从一个固定的数据集中获得数据进行学习,这是强化学习领域研究的一个热点。目前多数离线强化学习算法对策略训练过程进行保守正则化处理,训练策略倾向于选择存在于数据集中的动作,从...
关键词:离线强化学习 深度强化学习 强化学习 保守Q学习 不确定性 
增广立方体上边独立生成树的并行构造
《计算机科学》2024年第9期346-356,共11页李夏晶 程宝雷 樊建席 王岩 李晓瑞 
国家自然科学基金(62272333,62172291);江苏省教育厅未来网络科研基金资助(FNSRFP-2021-YB-39);江苏高校优势学科建设工程资助项目。
近年来,围绕互连网络的研究工作越来越多。其中独立生成树(Independent Spanning Trees,ISTs)可以应用于信息的可靠传输、并行传输、安全分发以及故障服务器的并行诊断中,因此受到了许多研究者的关注。在一对多广播、可靠通信、多节点...
关键词:互连网络 增广立方体 边独立生成树 并行算法 高度 
基于双视角建模的多智能体协作强化学习方法
《计算机学报》2024年第7期1582-1594,共13页刘全 施眉龙 黄志刚 张立华 
国家自然科学基金(62376179,62176175);新疆维吾尔自治区自然科学基金(2022D01A238);江苏高校优势学科建设工程资助项目资助.
在多智能体协作领域,强化学习算法通过共享智能体的局部信息来实现智能体间的协作.但共享协作机制极易引发过度协作问题,导致智能体忽视自身局部观测信息,丧失策略多样性,最终陷入低效协作的困境.为了解决该问题,本文提出基于双视角建...
关键词:深度强化学习 多智能体系统 多智能体协作 协作建模 对比学习 
MEPM模型:基于深度学习的多变量厄尔尼诺-南方涛动预测模型
《地球科学与环境学报》2024年第3期285-297,共13页方巍 张霄智 齐媚涵 
国家自然科学基金项目(42075007);江苏省计算机信息处理技术重点实验室开放研究基金项目(KJS2275);中国气象局交通气象重点开放实验室开放研究基金项目(BJG202306);中国气象局流域强降水重点开放实验室开放研究基金项目(2023BHR-Y14);江苏省研究生科研与实践创新计划项目(KYCX23_1388)。
厄尔尼诺-南方涛动(ENSO)是发生在热带太平洋年际时间尺度的海-气相互作用的异常现象,并由Nino3.4指数表征其发生情况;除此之外,ENSO与众多极端气候事件密切相关。因此,有效的ENSO预测对于预防极端气候事件和深入研究全球气候变化具有...
关键词:气候变化 厄尔尼诺-南方涛动 多气候变量 深度学习 时空序列预测 卷积神经网络 
基于互信息优化的Option-Critic算法
《计算机科学》2024年第2期252-258,共7页栗军伟 刘全 徐亚鹏 
国家自然科学基金(61772355,61702055);江苏省高等学校自然科学研究重大项目(18KJA520011,17KJA520004);吉林大学符号计算与知识工程教育部重点实验室资助项目(93K172014K04,93K172017K18);苏州市应用基础研究计划工业部分(SYG201422);江苏省高校优势学科建设工程资助项目。
时序抽象作为分层强化学习的重要研究内容,允许分层强化学习智能体在不同的时间尺度上学习策略,可以有效解决深度强化学习难以处理的稀疏奖励问题。如何端到端地学习到优秀的时序抽象策略一直是分层强化学习研究面临的挑战。Option-Crit...
关键词:深度强化学习 时序抽象 分层强化学习 互信息 内部奖励 Option多样性 
基于轨迹信息量的分层强化学习方法
《计算机科学》2023年第12期314-321,共8页徐亚鹏 刘全 栗军伟 
国家自然科学基金(61772355,61702055,61876217,62176175);江苏高校优势学科建设工程资助项目。
基于option的分层强化学习(The Option-Based Hierarchical Reinforcement Learning,O-HRL)算法具有时序抽象的特点,可以有效处理强化学习中难以解决的长时序、稀疏奖励等复杂问题。目前O-HRL方法的研究主要集中在数据效率提升方面,通...
关键词:OPTION 分层强化学习 轨迹信息 鉴别器 深度强化学习 
连通区域拓扑结构约束的甲骨拓片图像分割
《闽南师范大学学报(自然科学版)》2023年第4期35-50,共16页宋传鸣 周雨晴 张晋豪 洪飏 
辽宁省社会科学规划基金资助项目(L19BYY005)。
甲骨拓片图像往往遭受点状噪声、人工纹理和固有纹理等的严重影响,导致典型的图像分割方法尚无法得到令人满意的文字分割结果.为此,提出一种连通区域拓扑结构约束的甲骨拓片图像分割方法.该方法采用逐步求精的层次分割策略,首先,利用超...
关键词:甲骨拓片 图像分割 数字图像处理 连通区域 拓扑结构 形态学 
优势加权互信息最大化的最大熵分层强化学习被引量:2
《计算机学报》2023年第10期2066-2083,共18页乌兰 刘全 黄志刚 朱斐 张立华 
国家自然科学基金(62376179,61772355,61702055,61876217,62176175);新疆维吾尔自治区自然科学基金(2022D01A238);江苏高校优势学科建设工程资助项目(PAPD)资助.
近年来,深度强化学习在控制任务中取得了显著的效果.但受限于探索能力,难以快速且稳定地求解复杂任务.分层强化学习作为深度强化学习的重要分支,主要解决大规模问题.但是仍存在先验知识设定的不合理和无法有效平衡探索与利用等难题.针...
关键词:深度强化学习 分层强化学习 优势加权 互信息 最大熵 
深度卷积网络的自然场景文本检测研究综述被引量:1
《小型微型计算机系统》2023年第9期1996-2008,共13页宋传鸣 王一琦 武惠娟 何熠辉 洪飏 王相海 
国家社科基金冷门绝学研究专项项目(19VJX112)资助;教育部人文社会科学研究一般项目(21YJAZH075)资助;辽宁省社会科学规划基金资助项目(L19BYY005)资助;复旦大学“古文字与中华文明传承发展工程”规划项目(G3020)资助.
自然场景文本检测是从场景图像中获取文本信息的重要手段,但是仍旧面临背景复杂、文字种类丰富、排列方向多样、文本行组成复杂等因素的严峻挑战.研究检测精度高、通用性强、稳健性好的自然场景文本检测方法是目前计算机视觉领域的热点...
关键词:文本检测 自然场景文本 综述 深度学习 深度卷积网络 
检索报告 对象比较 聚类工具 使用帮助 返回顶部