检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]复旦大学计算机学院,上海200433 [2]上海交通大学软件学院,上海200240
出 处:《小型微型计算机系统》2016年第11期2391-2396,共6页Journal of Chinese Computer Systems
基 金:国家"八六三"高技术研究发展计划项目(2012AA010905)资助;国家自然科学基金青年项目(61402284)资助
摘 要:Intel Xeon Phi协处理器作为现阶段极具代表性的众核产品之一,为应用程序提供了强大的硬件环境和计算资源.然而,Xeon Phi所采用的内存设计存在高访问延迟的问题,因此非常依赖于缓存数据预取技术以提升访存性能.而Java作为一门具有自动内存管理且被广泛使用的语言,现有设计并未针对于Xeon Phi架构采取访存相关的优化.本文详细地研究了Xeon Phi上的缓存预取机制,并在Hot Spot虚拟机内部设计实现了一套动态的运行时缓存预取解决方案,该方案相比传统的静态方法和现有动态预取方案更适合于Xeon Phi众核架构及Java动态语言环境.本文通过实验表明,该动态预取方案在Xeon Phi众核平台上可以带来平均2.5倍的单线程加速比以及40%的多线程最优性能提升.Intel Xeon Phi coprocessor, as one of the most representative many-core products, provides very powerful hardware support and computing resources. However, the memory design that Xeon Phi employs has rather high access latency, thus relies heavily on cache data prefetching techniques for performance improvement. Java, as a widely-used language with automatic memory manage- ment, currently does not have such memory-related optimizations for Xeon Phi architecture. In this paper, we perform a comprehensive study on Xeon Phi's prefetching mechanism and propose a dynamic data prefetching solution with an implementation inside HotSpot virtual machine. Compared to traditional static methods and current dynamic prefetching schemes,our solution is more suitable for Xe- on Phi many-core architecture and Java dynamic runtime environment. The evaluation results demonstrate that our solution could achieve an averagely 2.5x performance speedup and improve the best multi-threaded throughput by 40% on Xeon Phi.
关 键 词:XEON Phi众核架构 JAVA虚拟机 数据预取
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.124