检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:刘子骏 何炎祥[1,2] 张军[1,3] 李清安[1,2] 沈凡凡[1]
机构地区:[1]武汉大学计算机学院,湖北武汉430072 [2]武汉大学软件工程国家重点实验室,湖北武汉430072 [3]东华理工大学软件学院,江西南昌330013
出 处:《计算机工程与科学》2017年第6期1011-1021,共11页Computer Engineering & Science
基 金:国家自然科学基金(61373039;61170022)
摘 要:随着通用图形处理器在高性能计算领域的广泛应用,新的并行执行模式被提出。在新模式下,当前的存储调度策略未能使存储器的吞吐率达到最大。分析了图形处理器上多程序并行执行模式下应用程序访存行为特征及其性能损失不公平的原因,提出了一种基于访存行为感知的存储调度策略,利用不同程序类型的优势进行优先级调度。实验表明,该方法能够明显改善不同类型程序间性能损失不均衡的问题,相比基准结构对所有测试程序的存储系统吞吐率和公平性分别有平均9.7%和15.0%的提升。As general purpose computing graphic units are widely used in high-performance compu- ting, a new concurrent execution model is proposed, under which the current memory scheduling policy is unable to achieve maximum memory throughput. We characterize different memory access behaviors of applications in the concurrent kernel execution on a single GPU platform, analyze the unbalanced per- formance loss across them, and propose a behavior-aware memory scheduling policy for GPGPU applica- tions. Different priority scheduling methods are employed to exploit the advantages of application types. Experimental results show a significant improvement onthe unbalanced performance loss among different types of applications. Averaged memory system throughput and fairness across all benchmarks are improved by 9.7% and 15.0% respectively over the baseline architecture.
分 类 号:TP303[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.118.210.110