检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]浙江大学超大规模集成电路设计研究所,杭州310027
出 处:《计算机工程》2015年第11期77-83,共7页Computer Engineering
基 金:国家自然科学基金资助项目(61204111);"核高基"重大专项(2010ZX01030-001-001-006)
摘 要:猜测并行化编译,即线程级猜测(TLS)编译,可将原来顺序运行的程序并行化。但由于猜测数据的不确定性引起的数据管理开销过大,以及猜测线程失败引起的线程回滚开销,使得并行后的执行性能较低。针对上述问题,提出一种HL-TLS并行化编译优化框架。HL-TLS能有效地标记并行化的循环体为热点循环体,采用对最高层次热点循环体进行更激进的并行化的方式提高性能,而对非热点循环体采用保守的顺序执行以减少开销。实验结果表明,使用HL-TLS编译优化框架,实验程序的执行效率可以提高20%。Thread Level Speculation (TLS) compiling can effectively improve the parallel efficiency. But the overheads,caused by the management of the speculative data and the failure of speculative thread' s rollback, decreases the improvement of the parallel performance. Aiming at the too big overhead of data management and thread rollback, the Hot Loops-TLS(HL-TLS) framework is proposed. HL-TLS marks the loops which can be efficiently paralleled as HL, using a more eager parallel way on HL to improve performance, while using conservative sequence way on non-HL to reduce the overheads. Experimental result shows that HL-TLS improves 20% performance.
关 键 词:并行计算 多线程 猜测执行 线程级猜测并行 热点循环 动态转换执行机制
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.44