检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王鑫[1] 张铭 Wang Xin;Zhang Ming(School of Internet of Things Engineering,Jiangnan University,Wuxi Jiangsu 214122,China)
机构地区:[1]江南大学物联网工程学院,江苏无锡214122
出 处:《计算机应用研究》2023年第6期1745-1749,共5页Application Research of Computers
基 金:高等学校学科创新引智计划项目(B12018)。
摘 要:针对应用普通卷积结构的卷积计算复杂度较高、计算量与参数量较大的问题,提出以国产SW26010P众核处理器为平台的并行分组卷积算法。核心思想是利用独特的数据布局,通过多核映射处理进行并行计算。实验测试结果表明,与单核串行算法相比,使用该并行分组卷积算法可以获得79.5的最高加速比及186.7MFLOPS的最大有效算力。通过SIMD指令对并行分组卷积算法进行数据并行优化后,与使用优化前的并行分组卷积算法相比,可以获得10.2的最高加速比。In order to solve the problems of high computational complexity,large computational cost and large number of parameters,this paper proposed the parallel group convolution algorithm based on the domestic SW26010P multi-core processor.The core idea was to use the unique data layout,through the multi-core mapping processing,parallel computing.Experimental results show that compared with single-core serial algorithm,the proposed parallel group convolution algorithm can achieve the highest speed-up ratio of 79.5 and the maximum effective computing power of 186.7MFLOPS.After data parallel optimization of the parallel group convolution algorithm by SIMD instruction,the algorithm obtains the highest speed-up ratio of 10.2 compared with the parallel group convolution algorithm before optimization.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.38