云存储中一种基于文件相似度的抽样重删索引算法  

Efficient Sampling Deduplication Index Algorithm Based on File Similarity for Cloud Storage

在线阅读下载全文

作  者:杨磊[1] 刘华[1] 肖德贵[1] 

机构地区:[1]湖南大学信息科学与工程学院,长沙410082

出  处:《小型微型计算机系统》2015年第10期2209-2212,共4页Journal of Chinese Computer Systems

基  金:国家自然科学基金项目(61272062)资助;湖南省自然科学基金项目(2015JJ2035)资助;中央高校基本科研业务费资助

摘  要:索引性能瓶颈制约着云存储下重复数据删除技术的发展和应用.通过分析影响索引性能的关键因素,提出一种基于抽样和相似度的重复数据删除索引算法.该方法利用基于文件级别的抽样,抽取每个文件部分指纹组成索引.通过减少指纹索引比对的范围和次数,提高索引检索的效率.当新写入文件的相似度达到临界值时,系统进行深度删冗,从而增加整体的重删率.Index performance bottleneck caused from deleting the redundant data restricts the deduplication technology development in storage system. In this paper, we propose a fast and stable index algorithm based on sampling and similarity for deduplication system. The approach uses sampling mechanism to extract some hash from each file. Therefore, it can increase the efficiency of retrieval by decreasing the scope and frequency of indexing. When the similarity of file written reaches a designated threshold,pushing system deleting redundant data in-depth,it could improve deduplication performance.

关 键 词:云存储 重复数据删除 索引 相似度 抽样 

分 类 号:TP309[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象