单指令多数据

作品数:77被引量:72H指数:4
导出分析报告
相关领域:自动化与计算机技术电子电信更多>>
相关作者:严晓浪陈志坚孟建熠秦兴刘衡竹更多>>
相关机构:英特尔公司高通股份有限公司超威半导体公司国防科学技术大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家科技重大专项国家重点基础研究发展计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
混洗SRAM:SRAM中的并行按位数据混洗
《计算机研究与发展》2025年第1期75-89,共15页张敦博 曾灵灵 王若曦 王耀华 沈立 
国家自然科学基金项目(61972407)。
向量处理单元(vector processing unit,VPU)已被广泛应用于神经网络、信号处理和高性能计算等处理器设计中,但其总体性能仍受限于专门用于对齐数据的混洗操作.传统上,处理器使用其数据混洗单元来处理混洗操作.然而,使用数据混洗单元来...
关键词:向量单指令多数据体系结构 静态随机访问存储器 混洗操作 向量内存 存内计算 
基于SIMD的VSIPL三角函数向量化技术研究
《航空计算技术》2024年第5期105-109,共5页闫妍 李典 李康 周磊 
国家重点研发计划项目资助(2017YFB301100)。
为提高嵌入式信号处理软件中三角函数的计算效率,并满足软件的可移植性需求,发展一种基于单指令多数据(SIMD)技术的三角函数向量化技术,并基于向量、信号与图像处理函数库(VSIPL)标准对向量化后的三角函数进行接口实现;同时,在ARM平台上...
关键词:嵌入式信号处理 向量化技术 向量三角函数 单指令多数据 向量、信号与图像处理函数库 
面向RISC-Ⅴ架构的目标检测算法优化
《智能安全》2024年第3期21-33,共13页任凭 徐学政 黄安文 李琼 
目标检测是计算机视觉领域最为重要的研究方向之一,被广泛应用于智能监控、自动驾驶、医学影像分析等领域。面对层出不穷的应用场景,往往需要依托特定的硬件平台部署目标检测算法,根据硬件平台的特点对目标检测算法进行优化可大大提高...
关键词:RISC-Ⅴ 目标检测 向量 单指令多数据 
基于SIMD的AVS3并行率失真优化量化算法
《电信科学》2024年第6期114-126,共13页唐毅欣 黄晓峰 唐然 周洋 崔燕 殷海兵 
国家科技重大专项(No.2021ZD0109802);国家自然科学基金资助项目(No.61901150)。
针对第三代音频视频标准(the third generation audio video coding standard,AVS3)中的率失真优化量化(rate-distortion optimization quantization,RDOQ)过程的编码效率问题,提出一种基于单指令多数据(single instruction multiple da...
关键词:AVS3 率失真优化量化 单指令多数据 并行加速 
便笺式存储器中一种新颖的交错映射数据布局
《计算机工程》2024年第5期33-40,共8页曾灵灵 张敦博 沈立 窦强 
国家自然科学基金面上项目(61972407)。
现代计算机一直沿用传统的线性数据布局模式,该模式允许对使用行主序模式存储的二维矩阵进行高效的行优先数据访问,但是增加了高效执行列优先数据访问的复杂性,造成列优先访问的空间局部性较差。改善列优先数据访存效率的常见解决方案...
关键词:矩阵转置 单指令多数据 便笺式存储器 数据布局 静态随机存储器 
基于CEVA-XC4500 DSP平台5G-LDPC码编码实现
《无线电工程》2024年第2期457-462,共6页吴思远 陈成 姜明 徐安来 
国家重点研发计划资助(2020YFB1807205)。
低密度奇偶校验(Low-Density Parity-Check,LDPC)码是第五代移动通信技术(5th Generation Mobile Communication Technology,5G)系统采用的信道编码技术之一,用于业务信道高速数据传输,具有很强的抗干扰能力和纠错能力。5G-LDPC码编译...
关键词:CEVA-XC4500 DSP 超长指令字 单指令多数据 5G-低密度奇偶校验码编码 矢量化 
面向RISC-V向量算法库的自动化测试方法
《智能安全》2023年第4期14-23,共10页崔焱旭 徐学政 陈莹 杨德亨 王涛 
RISC-V因其精简、开源、可定制的特点受到学术界和工业界的广泛关注,围绕RISC-V的软件生态也在逐步完善。2021年9月,RISC-V委员会发布了1.0版本的向量指令集规范(RVV),为面向RISC-V的数据级并行优化提供了标准,且部分算法库(如OpenCV)...
关键词:RISC-V 自动化测试 向量 单指令多数据 
一种嵌入式轻量化卷积神经网络计算加速方法被引量:1
《小型微型计算机系统》2023年第7期1345-1351,共7页谢媛媛 刘一睿 陈迟晓 康晓洋 张立华 
国家自然科学基金面上项目(61974033)资助;国家自然科学基金青年科学基金项目(61904038)资助;国家重点研发计划项目(2021YFC0122702)资助;上海市青年科技英才扬帆计划项目(19YF1403600)资助;上海市“科技创新行动计划”生物医药领域科技支撑项目(19441907600)资助;季华实验室项目(X190021TB190,X190021TB193)资助;上海市科技成果转化和产业化项目(19511132000)资助;上海市市级科技重大专项项目(2021SHZDZX0103)资助。
针对传统ARM处理器算力低、不适用于实时性需求比较高的应用场景的问题,本文提出了一种基于ARM处理器的单指令多数据(Single Instruction Multiple Data,SIMD)指令集的轻量化卷积神经网络计算加速方法,并将该方法用于处理脑电信号(Elect...
关键词:网络轻量化 可学习步长量化 单指令多数据 数据流架构 脑电信号 
面向飞腾迈创数字处理器的内核代码自动生成框架
《计算机研究与发展》2023年第6期1232-1245,共14页赵宵磊 陈照云 时洋 文梅 张春元 
国家自然科学基金项目(62002366)。
数字信号处理器(digital signal processor,DSP)通常采用超长指令字(very long instruction word,VLIW)和单指令多数据(single instruction multiple data,SIMD)的架构来提升处理器整体计算性能,从而适用于高性能计算、图像处理、嵌入...
关键词:内核代码生成 超长指令字-单指令多数据 循环分块 标量-向量协同 数字信号处理器 
基于CPU与GPU的异构模板计算优化研究被引量:4
《计算机工程》2023年第4期131-137,共7页李博 黄东强 贾金芳 吴利 王晓英 黄建强 
青海省科技厅应用基础研究项目(2022-ZJ-701);国家自然科学基金(62062059,62162053);青海省“昆仑英才·高端创新创业人才”项目;教育部“春晖计划”合作科研项目(QDCH2018001);青海大学2021年研究生课程建设项目(qdyk-210413);青海大学2021年度青年科研基金项目(2021-QGY-13);青海省骨干教师项目;清华大学-宁夏银川水联网数字治水联合研究院横向课题(SKL-IOW-2020TC2004-01)。
模板计算是一类使用固定模板的算法,被广泛应用于图像处理、计算流体动力学模拟等领域,现有的模板计算存在计算并行度弱、缓存命中率低、无法充分利用计算资源等问题。在消息传递接口(MPI)计算模型和跨平台多线程(OpenMP)计算模型的基...
关键词:模板计算 消息传递接口 跨平台多线程 单指令多数据 非一致内存访问 统一计算设备架构 
检索报告 对象比较 聚类工具 使用帮助 返回顶部