检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]湖南第一师范学院信息科学与工程系,长沙410205 [2]湖南大学嵌入式与网络计算湖南省重点实验室,长沙410082
出 处:《计算机工程与应用》2013年第16期221-224,共4页Computer Engineering and Applications
基 金:湖南省科技计划项目
摘 要:针对快速傅里叶变换下的快速大整数乘法,给出了一种基于CUDA架构的GPU并行化加速的实现方法。通过分析整数快速乘法中的每一步骤,分别给出各步骤的并行化实现方法,并采用数据压缩等策略,对算法进行优化。实验表明该方法有效地提高了算法效率,随着数据规模的增长,可获得18倍以上的加速比。Concerning the fast large integer multiplication based on fast Fourier transform, a GPU parallel method based on CU- DA architecture is proposed. By each steps in the fast large integer multiplication, parallel implementation is given respectively. Then the algorithm is optimized through data compression. Experiments result show that the method improves the efficiency of the algorithm, and can reach more than 18 times speedup ratio with the increase of data scale.
关 键 词:图形处理单元 统一计算设备架构 大整数乘法 快速傅里叶变换
分 类 号:TP312[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.217.244.16