检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:刘建华[1] 王朝尉[1] 任江勇[1] 田荣[1]
机构地区:[1]中国科学院计算技术研究所高性能计算机研究中心,北京100190
出 处:《计算机科学》2012年第6期293-296,共4页Computer Science
基 金:国家自然科学基金(11072241)资助
摘 要:长期以来,单精度似乎与科学计算无缘,然而从体系结构看,混合精度计算可以充分发挥向量部件、GPGPU设备的单精度性能,提供更高的效能,如降低通讯带宽要求、提高数据传输和通讯效率等。混合精度显格式有限元算法,结合材料强非线性多尺度有限元程序msFEM,实现了GPGPU上的有效加速。实验结果表明:混合精度显格式有限元程序实现了90%以上的计算通过单精度完成,其计算结果与全部使用双精度的结果相一致。该算法可以使得在不支持双精度格式的加速卡上实现科学计算功能。在支持双精度浮点格式的GPU上,混合精度算法与全部采用双精度计算相比其加速效果提高了1.6~1.7倍。For a long time,single precision has been giving away to double precision in scientific computing.However,on computer architectures,mixed-precision computing,can take full advantages of excellent computing compatibilities of vector components,GPGPU,offering merits such as reducing communication bandwidth requirements,improving data movement efficiency etc.A mixed-precision explicit finite-element algorithm was proposed and implemented on nVidia GPU for strongly nonlinear multi-scale material simulation.The developed mixed-precision finite-element method gives the same results as that of the fully double-precision calculation,while keeping a 90% portion of finite element calculations to be done by single precision float calculation.As a result,on the device that does not support native double precision float format,the mixed-precision algorithm makes it possible to fulfill double precision finite element simulation,while on the device that supports the native double precision,the mixed-precision algorithm is 1.6~1.7 times faster than the full double precision calculation.
分 类 号:TP391.7[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145