-

检索结果分析

结果分析中...
检索条件:"关键词=单指令多数据流计算 "
条 记 录,以下是1-1
视图:
排序:
显示条数:
基于ARMv8架构的面向机器翻译的单精度浮点通用矩阵乘法优化被引量:9
计算机应用》2019年第6期1557-1562,共6页龚鸣清 叶煌 张鉴 卢兴敬 陈伟 
国家重点研发计划项目(2016YFB0201100,2017YFB0202803);国家自然科学基金资助项目(11871454,91630204,61531166003);中国科学院战略性先导科技专项(B类)(XDB22020102);中国科学院信息化专项(XXH13506-204)~~
针对使用ARM处理器的移动智能设备执行神经网络推理计算效率不高的问题,提出了一套基于ARMv8架构的单精度浮点通用矩阵乘法(SGEMM)算法优化方案。首先,确定ARMv8架构的处理器执行SGEMM算法的计算效率受限于向量化计算单元使用方案、指...
关键词:ARMv8 单指令多数据流计算 基础线性代数子程序库 高性能计算 
检索报告 对象比较 聚类工具 使用帮助 返回顶部