检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]湖南大学信息科学与工程学院,长沙410082
出 处:《小型微型计算机系统》2015年第10期2209-2212,共4页Journal of Chinese Computer Systems
基 金:国家自然科学基金项目(61272062)资助;湖南省自然科学基金项目(2015JJ2035)资助;中央高校基本科研业务费资助
摘 要:索引性能瓶颈制约着云存储下重复数据删除技术的发展和应用.通过分析影响索引性能的关键因素,提出一种基于抽样和相似度的重复数据删除索引算法.该方法利用基于文件级别的抽样,抽取每个文件部分指纹组成索引.通过减少指纹索引比对的范围和次数,提高索引检索的效率.当新写入文件的相似度达到临界值时,系统进行深度删冗,从而增加整体的重删率.Index performance bottleneck caused from deleting the redundant data restricts the deduplication technology development in storage system. In this paper, we propose a fast and stable index algorithm based on sampling and similarity for deduplication system. The approach uses sampling mechanism to extract some hash from each file. Therefore, it can increase the efficiency of retrieval by decreasing the scope and frequency of indexing. When the similarity of file written reaches a designated threshold,pushing system deleting redundant data in-depth,it could improve deduplication performance.
分 类 号:TP309[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.4