一种基于OpenACC指令加速的素数生成算法  

在线阅读下载全文

作  者:杨帅[1] 

机构地区:[1]河南大学,河南开封475000

出  处:《信息与电脑》2016年第20期97-98,共2页Information & Computer

摘  要:当前,微机系统大多使用GPGPU设备加速计算,但是使用底层API进行并行加速效率不高且计算繁琐,使用基于指令的更高级抽象编程可解决这个问题。Open ACC就是为解决CUDA、Open CL等底层API开发的复杂性而开发出来的。笔者针对一种素数生成算法,分别使用CPU、CUDA、Open ACC实现,比较它们各自的效率,结果发现虽然Open ACC相比于CUDA性能要差一点,但是相比于CUDA陡峭的学习曲线和不高的开发效率,Open ACC有很高的性价比,并且随着硬件技术和编译器的发展,Open ACC有着非常广的发展空间。

关 键 词:OpenACC CUDA GPU 素数 

分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象