检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:党向磊[1,2] 王箫音[1,2] 佟冬[1,2] 陆俊林[1,2] 程旭[1,2] 王克义[1,2]
机构地区:[1]北京大学微处理器研究开发中心,北京100871 [2]北京大学微处理器及系统教育部工程研究中心,北京100871
出 处:《电子学报》2012年第11期2145-2151,共7页Acta Electronica Sinica
基 金:"核高基"重大专项(No.2009ZX01029-001-002);中国博士后科学基金(No.20110490208)
摘 要:为提高按序执行处理器的访存性能,本文提出一种预执行指导的数据预取方法(PEDP).PEDP利用跨距预取器对规则的访存模式进行预取,并在发生L2 Cache失效后通过预执行后续指令对不规则的访存模式进行精确的预取,从而结合两者的优势提高预取覆盖率.同时,PEDP利用预执行过程中提前捕获的真实访存信息指导跨距预取器的预取过程.在预执行的指导下,跨距预取器可以对预执行能够产生的符合跨距访存模式的地址更早地发起预取请求,从而改善预取及时性.此外,为进一步优化上述指导过程,PEDP使用更新过滤器有效去除指导过程中对跨距预取器的有害更新,从而提高预取准确率.实验结果表明,在平均情况下,PEDP将基准处理器的性能提升33.0%.与跨距预取和预执行各自单独使用相比,PEDP将性能分别提高16.2%和7.3%.This paper proposes a pre-execution directed prefetching(PEDP) method to improve the memory latency tolerance of in-order processors.PEDP utilizes stride prefetching to handle regular access patterns and pre-execution to generate accurate prefetches regardless of the regularity of access patterns when a L2 cache miss occurs,which combines the advantages of the two techniques to improve the prefetch coverage.Meanwhile,PEDP captures actual memory access patterns during pre-execution to guide the stride prefetcher′s update process.Under the guide of pre-execution,the stride prefetcher can issue prefetches earlier than pre-execution for addresses that can be generated by both of the two techniques,thus improving the prefetch timeliness.In addition,PEDP achieves improvement in prefetch accuracy by an update filter which effectively eliminates the harmful updates to the stride prefetcher during the guide process.Experimental results demonstrate that PEDP increases the performance by 33.0% over the baseline processor.Compared with stride prefetching and pre-execution,PEDP improves the performance by 16.2% and 7.3%,respectively.
分 类 号:TP302.7[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145