分片式处理器上的谓词执行技术优化  被引量:1

Optimization of the Predicated Execution Technique on Tiled Processor

在线阅读下载全文

作  者:邓春华[1] 安虹[1,2] 路璐[1] 王耀彬[1] 

机构地区:[1]中国科学技术大学计算机科学与技术学院,合肥230027 [2]中国科学院计算机体系结构重点实验室,北京100080

出  处:《小型微型计算机系统》2012年第2期399-403,共5页Journal of Chinese Computer Systems

基  金:国家自然科学基金重点项目(60633040)资助;国家自然科学基金项目(60970023)资助;国家"九七三"重点基础研究发展计划项目(2005CB321601)资助;国家"八六三"计划重大项目(2006AA01A102)资助;国家"八六三"高技术研究发展计划项目(2009AA01Z106)资助;国家科技重大专项项目(2009ZX01036-001-002)资助;教育部-英特尔信息技术专项科研基金项目(MOE-INTEL-08-07)资助

摘  要:谓词执行能使分片式处理器充分利用众多的执行单元,开发指令级并行性.但因此形成的超块也使得分支误预测代价增大,所以提高分支预测器的性能至关重要.本文提出一种基于剖析信息决策的谓词执行技术,该技术利用剖析信息对谓词执行前后的执行周期进行估算,从而对分支的谓词执行进行决策.该技术使分支预测器的命中率提高了0.68%~3.50%,使系统性能提高了1.67%~8.33%.同时,利用select指令表示谓词化指令也消除了重命名阶段寄存器多定义问题.Predicated execution enables tiled processor to fully utilize numerous execution units and exploit instruction level parallel- ism. However, the increasing size of execution block leads to more rollbacks of instructions in case of mispredication. Therefore, im- proving the performance of branch predicator is vitally important. In this paper, we propose a new predicated execution technique based on profiling information. This technique estimates the periods before and after predicated execution using the profiling informa- tion, and in turn decides the consequent predication. Our proposal improves the predication hit rate by 0.68% ~ 3.50%, and overall system performance by 1.67% ~ 8.33%. Moreover, we adopt select instruction to represent predicated instruction. This successfully eliminates register multi-definition in renaming phase.

关 键 词:谓词执行 分片式处理器 分支预测器 剖析信息 

分 类 号:TP303[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象