并行度

作品数:98被引量:226H指数:7
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:金海李丽李伟马莉刘强更多>>
相关机构:北京大学华中科技大学华为技术有限公司上海交通大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划上海市自然科学基金教育部科学技术研究重点项目更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
一种JPEG-XS编码器的硬件架构优化设计
《电子与封装》2025年第2期55-61,共7页李雅欣 吴林煌 刘伟 郑畅 
为将JPEG-XS这一主流的浅压缩算法与现场可编程门阵列(FPGA)相结合,设计了一种适用于高分辨率、高帧率应用场景的视频编码器,提出了一种完整的JPEG-XS编码器硬件方案。对整个编码器进行流水线编码设计,实现模块间时间上的复用,对于模块...
关键词:JPEG-XS 硬件架构 现场可编程门阵列 并行度 
FPGA实现卷积神经网络加速器
《高技术通讯》2023年第10期1060-1067,共8页张立国 黄文汉 金梅 
国家重点研发计划(2020YFB1711001)资助项目。
卷积神经网络传统的应用平台是中央处理器(CPU)和图形处理器(GPU),其体积和功耗不能适应轻量化的行业,轻量化的专用集成电路(ASIC)平台专用加速器的开发成本又不能适应愈发复杂和深层次的网络结构。针对上述问题,设计一种基于现场可编...
关键词:现场可编程门阵列(FPGA) 卷积神经网络(CNN) 硬件加速器 并行度 
一种自适应图像插值算法及加速引擎的协同设计被引量:1
《电子与信息学报》2023年第9期3284-3294,共11页严忻恺 丁晟 
江苏省高等学校自然科学研究项目(19KJB510027);江苏省“333工程”科研资助项目(BRA2020318);江苏省专用集成电路设计重点实验室开放基金(2020KLOP005)。
为提高高清彩色图像超分辨率重建效果,该文提出了一种基于边缘对比度的新型自适应图像插值算法。使用边缘对比度检测和不同尺度的感受野来自适应选择Lanczos插值的系数,自适应性和不同感受野可以进一步提升图像放大质量,图像质量相比于...
关键词:插值算法 自适应 并行度 高能效 加速引擎 
As-Stream:一种针对波动数据流的算子智能并行化策略
《清华大学学报(自然科学版)》2022年第12期1851-1863,共13页李维 李城龙 杨家海 
国家自然科学基金面上项目(62172251);清华大学自主科研计划资助(2021Z11GHX010)。
大量研究提出了从在线资源管理层面来优化波动数据流的方法,却忽略了从流应用层面来优化算子并行度。例如,在Apache Storm中,算子并行度一旦设置就无法进行动态调整。该文提出了一种针对波动数据流的算子智能并行化策略As-Stream,显著...
关键词:流计算 机器学习 算子并行度 资源分配 
面向灵活并行度的稀疏卷积神经网络加速器被引量:3
《电子学报》2022年第8期1811-1818,共8页袁海英 曾智勇 成君鹏 
大规模卷积神经网络计算复杂度高且资源开销大,这极大提高了深度学习算法的硬件部署成本.在模型推理过程中充分利用层间稀疏激活的信息冗余,以较低资源开销和几乎无损的网络精度降低推理时延和功耗提供高效的加速器解决方案.针对稀疏卷...
关键词:FPGA 卷积神经网络 硬件加速 稀疏感知 并行计算 
对充气膜结构实验室建筑施工工艺的技术改进被引量:9
《石油化工建设》2022年第5期113-116,共4页陈均响 陈戊荣 李雯琪 
针对充气膜结构大规模核酸检测实验室的自身特点,提出了一些对传统施工工艺的改进方法。对于满足医学检测实验室、试剂生产车间、隔离病房等实验室对环境的要求,确保符合BSL-2级生物安全实验室的建设标准,提高搭建效率,延长建筑的使用...
关键词:充气膜结构 深度预制 模块化集成 并行度 施工工艺 技术改进 
一种基于三维可变换CNN加速结构的并行度优化搜索算法被引量:1
《电子与信息学报》2022年第4期1503-1512,共10页屈心媛 徐宇 黄志洪 蔡刚 方震 
国家自然科学基金(61704173,61974146);北京市科技重大专项(Z171100000117019)。
现场可编程门阵列(FPGA)被广泛应用于卷积神经网络(CNN)的硬件加速中。为优化加速器性能,Qu等人(2021)提出了一种3维可变换的CNN加速结构,但该结构使得并行度探索空间爆炸增长,搜索最优并行度的时间开销激增,严重降低了加速器实现的可...
关键词:现场可编程门阵列 卷积神经网络 硬件加速 
浅谈Spark性能优化方法
《信息与电脑》2022年第2期53-55,共3页韦统边 吴江波 苏德 张亮 韦通明 
随着物联网的快速发展和科技的进步,社会各行业的数据量正以前所未有的速度和规模在增长,如何在海量数据中快速获得有价值的数据也成为企业关注的重点。Spark作为目前最流行的开源大数据处理框架,受底层机制复杂和集群资源的限制,常出...
关键词:物联网 价值 计算 SPARK 并行度 
一种基于HiveSQL的增加任务并行度与建立中间表组合的优化查询方法被引量:3
《现代计算机》2021年第36期55-59,共5页郑灵逸 李擎 
针对大数据时代数据量级随时间不断累积、在大数据环境中查询数据困难且缓慢的问题,提出一种基于HiveSQL的增加任务并行度与建立中间表组合的优化查询方法。本文应用的是Hadoop生态系统中Hive数据库,从Hive数据库里数据量级为Pb的数据当...
关键词:大数据查询优化 Hive SQL任务并行 建立中间表 
面向自动搜索型神经网络的加速器设计与实现被引量:1
《微电子学与计算机》2021年第11期88-94,共7页贺文 祝永新 汪辉 黄尊恺 
国家重点研发计划(2019YFB2204204);上海浦东科技与经济委员会科研计划项目(PKX2019-D02);上海市科学技术委员会科研计划项目(19511131202);中国科学院战略性先导科技专项(C类)(XDC02070800);中科院上海高等研究院院内人才项目(E052891ZZ1);上海高等研究院与上海光源合作项目(E0560W1ZZ0)。
近年来,通过神经网络架构搜索(NAS)得到的自动搜索型神经网络在视觉任务中表现尤为突出,然而,其更为复杂多变的卷积规模和运算方式限制了其在边缘侧设备的应用.为解决这一问题,针对自动搜索型神经网络搜索空间中各种复杂多变的计算方式...
关键词:自动搜索型神经网络 阵列复用 混合并行度 可变精度 FPGA 
检索报告 对象比较 聚类工具 使用帮助 返回顶部