SIMD指令

作品数:14被引量:35H指数:2
导出分析报告
相关领域:自动化与计算机技术电子电信更多>>
相关作者:赵常智赵龙淡孝强唐敏李东晓更多>>
相关机构:国防科学技术大学浙江大学解放军信息工程大学北京君正集成电路股份有限公司更多>>
相关期刊:《计算机研究与发展》《计算机工程》《中国集成电路》《科技视界》更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划国家科技重大专项更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
SIMD指令及其在C++编程语言中的应用被引量:1
《科技视界》2024年第8期15-17,共3页张小丹 杨严硕 胡婉靖 王亚峰 肖春杨 
2022年度宝鸡文理学院第十七批校级本科教学改革研究项目(编号:22JGYB37);陕西省教育厅项目(编号:23JK0287);陕西省教育厅项目(22JK0242);陕西省科技厅重点研发计划一般项目(编号:2024SF-YBXM-134);2023年教育部产学合作协同育人项目(编号:230705211175618);宝鸡文理学院2023年大学生创新创业训练计划项目(编号:S202310721033);宝鸡文理学院教改项目(YJ22JGYB13)。
单指令多数据流指令是一种非常有效的单线程加速方法,通过使用SIMD指令集,计算机可以同时对多个数据执行相同的运算,从而实现程序加速。针对SIMD的具体应用,文章结合目前常用的C++语言进行加速过程讲解与代码编程,介绍了SIMD相关基本概...
关键词:SIMD指令集 程序加速 单线程加速 程序优化 
基于申威SIMD指令的H.264编码优化被引量:2
《现代电子技术》2024年第6期49-54,共6页黄朴 刘世巍 张昊 王聪 
国产化申威处理器出现较晚,其在多媒体领域中的性能还不突出,同时通用处理器中的单指令流多数据流(SIMD)因能有效提升并行处理能力而受到处理器厂商的青睐。为提高国产化自主平台申威架构的多媒体处理能力,结合申威架构Core3B体系的SIM...
关键词:单指令流多数据流 H.264标准 申威处理器 热点函数 程序并行化 细粒度 
基于QEMU翻译系统SIMD指令翻译优化方法
《信息工程大学学报》2019年第3期308-312,共5页石强 赵荣彩 高亚虎 王军 
国家自然科学基金资助项目(61472447)
SIMD指令在大多数现代处理器架构中是必需的拓展部件。使用SIMD指令能同时对一组数据执行相同操作,从而实现空间上的并行性,显著提高处理性能。因此SIMD指令在二进制文件中指令的比例显著提高。但大部分动态二进制翻译器忽视了SIMD指令...
关键词:二进制翻译 SIMD指令 中间表示 优化 
一种新型自动向量化编译算法
《武汉大学学报(理学版)》2016年第5期456-463,共8页吕鹏伟 刘从新 沈绪榜 
核高基重大专项(2014ZX01020-003);国家自然科学基金项目资助(61136002);国家863计划资助项目(2015AA7015028)
SIMD(single instruction multiple data)体系结构在高性能计算与嵌入式多媒体计算中扮演着重要的角色,对于SIMD指令的自动向量化编译技术是当前编译领域的研究热点.本文基于超字并行(super-word level parallelism,SLP)算法提出了一种...
关键词:SIMD指令 编译技术 自动向量化 超字并行 超字复用 
BWDSP SIMD指令的WHIRL中间表示生成研究被引量:1
《中国集成电路》2015年第3期30-35,共6页王昊 王向前 
WHIRL是Open64采用的一种通用的中间表示,支持多种高级语言和多种目标机。Open64的后端优化工作都是基于WHIRL设计的。BWDSP是一款支持SIMD指令的数字信号处理器,SIMD指令能够提高该处理器的指令并行性。SIMD优化也需要产生WHIRL中间表...
关键词:数字信号处理器 单指令多数据 WHIRL 中间表示 
基于SIMD指令的ECC攻击算法研究被引量:1
《计算机研究与发展》2012年第7期1553-1559,共7页赵龙 韩文报 杨宏志 
国家"八六三"高技术研究发展计划基金项目(2009AA01Z417);国家"九七三"重点基础研究计划基金项目(2007CB807902);全国优秀博士学位论文作者专项基金项目(FANEDD-2007B74)
ECC是目前比特安全强度最高的公钥密码体制,对它的攻击需要大量的计算资源.基于SIMD指令和bitslice数据结构设计了GF(2m)上的ECC攻击算法,并对核心模块进行了优化.利用比特交换的方法提出了一个bitslice数据结构和非bitslice数据结构的...
关键词:椭圆曲线密码体制 椭圆曲线离散对数问题 ECC挑战 Pollard rho算法 SIMD指令 
基于SIMD指令的柔性物体并行碰撞检测被引量:13
《计算机学报》2009年第10期2042-2051,共10页唐敏 MANOCHA Dinesh 童若锋 
国家自然科学基金(60803054);教育部-英特尔信息技术专项科研基金项目(MOE-INTEL-09-05)资助
复杂场景中柔性物体间的碰撞检测依然难以满足交互设计的要求.为了提高处理速度,文中给出了一种充分利用现代CPU的并行处理能力的碰撞检测算法.算法基于两方面的并行处理:即基于SIMD指令的指令级并行处理和基于多线程的任务级并行处理....
关键词:连续碰撞检测 柔性物体 SIMD指令 并行碰撞检测 包围盒层次结构 
利用SIMD指令加速VLSI设计规则检查被引量:1
《微电子学与计算机》2008年第7期68-71,共4页赵冬晖 潘日华 池凤彬 
提出通过利用SIMD技术强大的运算能力和并行能力,有效地提高DRC效率的方法.实验表明经过利用SIMD方法优化后的DRC算法的效率,是经编译器优化DRC的2倍左右,与原始的C代码DRC算法相比有一个数量级的提高.
关键词:VLSI DRC SIMD SSE指令集 
基于Intel SIMD指令的二维FFT优化算法被引量:11
《计算机工程与应用》2007年第5期41-44,共4页李成军 周卫峰 朱重光 
在基于频域的大数据量图像处理算法中,最为耗时的步骤就是对图像数据进行二维FFT变换的过程。论文针对这一问题,提出一种基于Intel SIMD指令的二维FFT优化算法。通过将数据按照便于SIMD指令计算的方式进行组织,利用SSE3指令加速复数乘法...
关键词:大数据量图像处理 二维FFT SIMD SSE/SSE3 
一种支持SIMD指令的流水化可拆分乘加器结构被引量:2
《计算机工程》2006年第7期264-266,共3页李东晓 
国家自然科学基金资助项目(90307002);国家"863"计划基金资助项目(2002AA1Z1140)
乘加器是媒体数字信号处理器的关键运算部件。该文结合32位数字信号处理器芯片MD32开发(“863”计划)实践,提出了一种流水化可拆分的乘加器硬件实现结构,通过对乘法操作的流水处理实现了200MHz工作频率下的单周期吞吐量指标,通过构造可...
关键词:乘加器 SIMD 流水化 可拆分 
检索报告 对象比较 聚类工具 使用帮助 返回顶部