检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:田林琳[1] 刘业峰[1] 关世杰[1] TIAN Linlin;LIU Yefeng;GUAN Shijie(School of Information and Control,Shenyang Institute of Technology,Fushun 113122)
机构地区:[1]沈阳工学院信息与控制学院
出 处:《计算机与数字工程》2019年第10期2503-2508,共6页Computer & Digital Engineering
基 金:国家自然科学基金项目(编号:61603262);辽宁省教育厅科学研究一般项目(编号:L2015380)资助
摘 要:为解决支持向量机(SVM)分类算法性能不能满足实时性要求的问题,提出了一种使用Intel高级矢量扩展指令集(AVX)对SVM分类算法进行并行加速的计算方法。首先以LIBSVM的串行版本作为算法优化的基准,分析了LIBSVM训练阶段产生的模型文件读入内存后的布局特点,给出了满足AVX指令集操作的内存布局优化方案,接着在满足分类结果精度的前提下以单精度代替双精度浮点,提高了算法的并行度,最后使用OpenMP技术在多核平台下对并行算法进行了多线程优化,提高了CPU计算资源的利用率。实验结果表明,并行优化版本相对其串行版本加速约15倍左右,满足了系统的性能要求。To solve the real-time requirement of support vector machine(SVM)prediction algorithm,a new approach to accelerate the algorithm using Intel Advanced Vector Extensions(AVX)is presented.Firstly,the serial version in the LIBSVM is settled as the optimization benchmark,the memory layout characteristics of model file generated by SVM training phase is analyzed,the optimized layout suitable for AVX is proposed.In order to improve the parallelism of the algorithm,the double float is replaced by the single float based on the accuracy of classification results.Finally,the OpenMP technology is used to optimize the SIMD algorithm on multi-core platform,which improved the utilization of CPU computing resources.The experiment shows a 15x times speed up and it can meet the performance requirements of the system.
关 键 词:高级矢量扩展指令集 支持向量机 并行度 内存布局 LIBSVM
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7