大规模图挖掘算法并行化研究  

Survey on large scale graph mining parallelization

在线阅读下载全文

作  者:陈琳[1] 赵政文[1] 李强[2] 

机构地区:[1]西北工业大学计算机学院,陕西西安710129 [2]西北工业大学软件与微电子学院,陕西西安710129

出  处:《计算机工程与设计》2012年第9期3465-3469,3474,共6页Computer Engineering and Design

基  金:国家自然科学基金项目(60803043;60873196;61033007);国家863高技术研究发展计划基金项目(2009AA01A404)

摘  要:目前大规模图挖掘算法的思路是基于MapReduce将矩阵与向量相乘的过程并行化,但却没有针对MapReduce特点对图数据进行划分,会产生大量中间结果,算法代价较高。针对这些问题,提出了GIM-V LI算法。该算法采用数据划分思想,将图矩阵横向划分,结合MapReduce特点以行为单位替代点或块的数据组织方式,并设计出<key,value>结构,使一个单位数据仅产生一个中间结果,从而大大减少了中间结果,提高了算法的性能。通过大量实验分析验证了该改进算法的正确性与有效性。The design of large scale graph mining depends on the parallelization of matrix-vector multiplication based on MapReduce.But it will produce a large number of intermediate results due to the lack of data division.To reduce the cost of the algorithm,the GIM-V LI algorithm is proposed.The data partitioning ideas are adopted,the input graph data based on line is divided according to characteristic of MapReduce,and the structure of key,value pair is designed to reduce the intermediate results by one unit data producing only an intermediate result.Extensive experiments verify the correctness and effectiveness of the algorithm.

关 键 词:大规模图挖掘 矩阵与向量相乘 数据划分 MAPREDUCE GIM-VLI 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象