大数据下基于多CPU的两级指纹流水计算去重方法  被引量:1

Duplicate Removal Method of Large Data under Two Level Fingerprins Flow Based on Multi CPU Calculation

在线阅读下载全文

作  者:贺建英[1] 袁小艳[1] 唐青松[1] 

机构地区:[1]四川文理学院计算机学院,达州635000

出  处:《计算机系统应用》2015年第8期206-211,共6页Computer Systems & Applications

基  金:国家档案局项目(2014-X-65);四川省教育厅一般项目(14ZB0313)

摘  要:分析数据去重的重要意义,根据现有的数据去重技术和算法,改进MD5码指纹的计算算法并进行优化,分析并重组指纹计算的流水化方法,利用缓存组代替单个缓存的方式,提出一种基于多CPU的两级指纹流水计算方法,对该方法进行分析研究,并通过相关试验和试验数据来支持该方法的有效性.This paper analyzes the importance of data removal. According to the existing data of the removal techniques and algorithms, it improves MD5 code fingerprint algorithm to calculate and optimize it, analyzes and recombines the fingerprint calculation of water level. Using the cache group to replace the single cache, we propose a new method to calculate the two water level fingerprints based on multi CPU to study and analyze the method. At the same time, it supports effectiveness of the method through the relevant tests and test data.

关 键 词:数据去重 多CPU 两级指纹 算法 缓存组 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象