存储系统中的频繁访问模式挖掘  

Mining frequent access patterns in storage systems

在线阅读下载全文

作  者:朱旭东[1,2] 卜庆忠[1,2] 柯剑[1,2] 那文武[1,2] 许鲁[1] 

机构地区:[1]中国科学院计算技术研究所,北京100190 [2]中国科学院研究生院,北京100039

出  处:《高技术通讯》2009年第7期699-705,共7页Chinese High Technology Letters

基  金:863计划(2007AA01Z402);973计划(2004CB318205)资助项目。

摘  要:研究、分析了影响经典的模式挖掘方法挖掘频繁访问模式的效率,使其难以被存储系统接受的主要因素——噪音的产生原因和表现类型,提出一种具有噪音过滤能力,适应存储系统频繁访问序列模式挖掘的新方法——Z-Miner。Z-Miner使用全局分支裁剪和分支聚类方法来过滤噪音,对实际系统工作负载的模拟结果显示,Z-Miner指导的预取可以使缓存失效率降低40%~66%,平均响应时间降低26%~66%。相对经典挖掘方法,Z-Miner的挖掘开销有1~2个数量级的下降,而预取优化效果提高了1倍。Based on the analysis of the effect mechanism of the noise, a major factor that lowers the efficiency of frequent access pattern mining and makes classic mining methods unacceptable for storage systems, this paper proposes a novel mining method Z-Miner. The Z-Miner employs a global-branch-cutting and branch-clustering approach for noise filtering. The simulation results under real workloads show that the prefetching directed by the Z-Miner could reduce the cache miss ratio by 40 % - 66 %, and the average response time by 26 % - 66 %. Compared with classic mining methods, the overhead of the Z-Miner is 1 to 2 orders of magnitude less, while the efficiency of the prefetching is two times more.

关 键 词:频繁访问模式 数据块关系 序列模式挖掘 聚类 预取 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论] TP333[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象