基于大数据集的协同过滤算法的并行化研究  被引量:19

Collaborative filtering algorithmparallelize research based on large data sets

在线阅读下载全文

作  者:李改[1,2,3] 潘嵘[2,3] 李章凤[2] 李磊[2,3] 

机构地区:[1]顺德职业技术学院电子与信息工程系,广东顺德528300 [2]中山大学信息科学与技术学院,广东广州510006 [3]中山大学软件研究所,广东广州510275

出  处:《计算机工程与设计》2012年第6期2437-2441,共5页Computer Engineering and Design

基  金:国家自然科学基金项目(61003140;61033010)

摘  要:通过对基于ALS的协同过滤算法及分布式Hadoop平台的相关特性进行深入研究,将基于ALS的协同过滤算法在Hadoop上进行并行化,解决了传统的基于ALS的协同过滤算法在大规模数据集上的运算问题。经过实验验证,在Ha-doop平台上实现的并行化的ALS协同过滤算法不仅能够保证实验结果的准确性,而且与单节点上实现的算法相比,运算效率显著提高。Through intensive study the property of the distributed platform-Hadoop and the collaborative filtering algorithm based on ALS,a Parallel collaborative filtering algorithm based on ALS in Hadoop is presented and the computing problem of large-scale data is solved in the collaborative filtering algorithm.Experimental results show that the Parallel algorithm based on ALS implemented in Hadoop can not only guarantee the accuracy of experimental results,but also improve the computing efficiency compare with the algorithm implemented in single node.

关 键 词:推荐系统 协同过滤 HADOOP 交叉最小二乘法 并行化 

分 类 号:TP309[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象