金旭

作品数:11被引量:39H指数:3
导出分析报告
供职机构:中国科学技术大学计算机科学与技术学院更多>>
发文主题:卷积神经网络多核处理器处理器多示例学习组织病理学更多>>
发文领域:自动化与计算机技术电子电信更多>>
发文期刊:《小型微型计算机系统》《中国图象图形学报》《计算机系统应用》《计算机研究与发展》更多>>
所获基金:中央高校基本科研业务费专项资金国家高技术研究发展计划国家自然科学基金国家重点基础研究发展计划更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
用于脑肿瘤分割的N形神经网络
《小型微型计算机系统》2025年第2期365-372,共8页迟孟贤 安虹 金旭 许延杰 聂振国 
国家重点研发项目(2022YFB4703000)资助。
传统的U型神经网络网络在脑肿瘤分割任务中存在高层信息表征能力不足和分割标签不平衡等问题.本文提出了一种新型脑肿瘤分割模型N-Net,能够有效融合多尺度信息,综合考虑全局语义与局部细节,提高了对不同大小肿瘤的分割性能.模型引入特...
关键词:脑肿瘤分割 特征金字塔 注意力机制 混合损失函数 N形神经网络 
申威26010众核处理器上Winograd卷积算法的研究与优化被引量:2
《计算机研究与发展》2024年第4期955-972,共18页武铮 金旭 安虹 
国家重点研发计划项目(2018YFB0204102)。
卷积作为深度学习中被频繁使用的关键部分,其并行算法的研究已成为高性能计算领域中的热门话题.随着我国自主研发的申威26010众核处理器在人工智能领域的快速发展,对面向该处理器的高性能并行卷积算法提出了迫切的需求.针对申威26010处...
关键词:深度学习 Winograd卷积 高性能计算 并行算法 申威处理器 
针对SW26010众核处理器的单精度矩阵乘算法
《小型微型计算机系统》2023年第4期673-681,共9页武铮 许乐 安虹 金旭 文可 
国家重点研究开发项目(2018YFB0204102)资助。
矩阵乘作为许多科学应用中被频繁使用的关键部分,其计算量巨大且稠密的本质,使得高性能计算领域中矩阵乘并行算法的研究一直是经久不衰的热门话题.随着我国自主研发的申威众核处理器SW26010在科学计算和人工智能领域的快速发展,对面向SW...
关键词:众核处理器 矩阵乘 计算机系统结构 高性能计算 并行算法 
CentroidNet:轻量快速的乳腺癌Ki67细胞核中心点检测模型被引量:1
《中国图象图形学报》2023年第4期1119-1133,共15页文可 金旭 安虹 何杰 王珏 
中央高校基本科研业务费专项资金资助(YD2150002001)。
目的Ki67分数是乳腺癌预后评估的重要指标,计算该分数的关键步骤是检测阴性与阳性癌细胞核。人工检测面临疲劳与主观差异的问题。卷积神经网络有望实现高质量、自动化的细胞核检测,然而需要病理专家为其标注细胞核。为了减轻标注的工作...
关键词:乳腺癌 Ki67分数 中心点检测 一对一标签匹配 锚点 
2D级联CNN模型的放疗危及器官自动分割被引量:1
《中国图象图形学报》2020年第10期2110-2118,共9页石军 赵敏帆 薛旭东 郝晓宇 金旭 安虹 张红雁 
国家重点研发计划项目(2016YFB1000403);中央高校基本科研业务费专项资金资助。
目的精准的危及器官(organs at risk,OARs)勾画是肿瘤放射治疗过程中的关键步骤。依赖人工的勾画方式不仅耗费时力,且勾画精度容易受图像质量及医生主观经验等因素的影响。本文提出了一种2D级联卷积神经网络(convolutional neural netwo...
关键词:危及器官分割 卷积神经网络 级联模型 放射治疗 宫颈癌 
深度学习在组织病理学中的应用综述被引量:17
《中国图象图形学报》2020年第10期1982-1993,共12页金旭 文可 吕国锋 石军 迟孟贤 武铮 安虹 
国家重点研发计划项目(2016YFB1000403);中央高校基本科研业务费专项资金资助。
组织病理学是临床上肿瘤诊断的金标准,直接关系到治疗的开展与预后的评估。来自临床的需求为组织病理诊断提出了质量与效率两个方面的挑战。组织病理诊断涉及大量繁重的病理切片判读任务,高度依赖医生的经验,但病理医生的培养周期长,人...
关键词:组织病理学 深度学习 卷积神经网络 迁移学习 多示例学习 
主流卷积神经网络的硬件设计与性能分析
《计算机系统应用》2020年第2期49-57,共9页徐青青 安虹 武铮 金旭 
国家重点研发计划(2016YFB1000403);中央高校基本科研业务费专项资金(YD2150002001)~~
作为深度学习领域中最具有影响力的网络结构之一,卷积神经网络朝着更深更复杂的方向发展,对硬件计算能力提出了更高的要求,随之出现了神经网络专用处理器.为了对这类处理器进行客观比较,并指导软硬件优化设计,本文针对卷积神经网络提出...
关键词:卷积神经网络 网络层 基准测试程序 性能分析 微体系结构 
利用OpenCL设计并优化FPGA上的全连接神经网络被引量:5
《小型微型计算机系统》2019年第2期348-352,共5页周鑫 安虹 迟孟贤 金旭 韩文廷 
国家重点研发计划项目(2016YFB1000403)资助
随着深度学习神经网络的发展,FPGA上的神经网络开发获得了广泛关注.本文利用Intel FPGA提供的OpenCL SDK,在FPGA板卡上设计并实现了完整的全连接神经网络的前向模型,并针对基准系统中的存储瓶颈,通过分组划分、数据复用、优化激活函数...
关键词:FPGA OPENCL 全连接神经网络 优化 
循环神经网络在语音识别模型中的训练加速方法被引量:9
《小型微型计算机系统》2018年第12期2561-2565,共5页冯诗影 韩文廷 金旭 迟孟贤 安虹 
国家重点研发计划项目(2016YFB1000403)资助
深度神经网络目前已被广泛应用于众多领域.尤其在自然语言处理领域,基于循环神经网络的模型训练效果明显优于其他传统方法.然而模型复杂度不断提高,有限存储空间成为进一步训练大规模任务的瓶颈,例如使用图形处理器(GPU)进行加速训练....
关键词:循环神经网络 语音识别 GPU 序列分组 存储 
基于分布式模拟机制的片上网络硬件模拟系统被引量:1
《计算机工程》2016年第5期71-79,共9页彭毅 安虹 金旭 程亦超 迟孟贤 孙荪 
国家自然科学基金资助项目(60970023);国家"973"计划基金资助项目(2011CB302501);国家"863"计划基金资助项目(2012AA010902;2012AA010901)
针对基于现场可编程门阵列的DART模拟器可扩展性较差和模拟精度较低的问题,提出一种硬件友好的分布式模拟机制。该机制在模拟中采用隐式同步方法,以节点内计数器和节点间缓冲队列取代集中式控制器,将时序同步和计数任务交给每个节点自...
关键词:片上网络 分布式模拟 现场可编程门阵列 多核处理器 时钟精确 动态路障同步 
检索报告 对象比较 聚类工具 使用帮助 返回顶部