HybridFA:一种基于统计的AC自动机空间优化技术  被引量:4

Hybrid FA: a memory reduction technique for the AC automata based on statistics

在线阅读下载全文

作  者:熊刚[1] 何慧敏 于静[1] 刘燕兵[1] 郭莉[1] 

机构地区:[1]中国科学院信息工程研究所,北京100093 [2]中国移动(深圳)有限公司,深圳518031

出  处:《通信学报》2015年第7期31-39,共9页Journal on Communications

基  金:中国科学院战略性科技先导专项基金资助项目(XDA06030602);国家高技术研究发展计划("863"计划)基金资助项目(2011AA010703);国家自然科学基金青年基金资助项目(61202477)~~

摘  要:针对高级Aho-Corasick(AC)自动机为提高串匹配速度而造成的空间浪费问题,研究发现数据流对自动机节点的访问规律,据此提出基于数据访问特征的混合自动机构建算法Hybrid FA。分别研究了基于访问频率、访问层次以及结合上述2种特征对AC自动机的部分节点实现完全化的算法。在Snort、Clam AV、URL等真实数据集上的实验结果表明,Hybrid FA算法的存储空间低于高级AC自动机的5%。此外,结合访问频率和访问层次的改进算法在保证匹配速度的同时具有更强的数据适应性。Despite the fast speed in multiple string matching tasks, the advanced Aho-Corasick(AC) automata wastes storage memory to a great extent. Study indicated that the automata states have specific statistical access characteristics in practice. Accordingly, a series of algorithms based on statistical characteristics for building hybrid finite automata, named Hybrid FA, are proposed. This work completes partial states of the AC automata according to different features, including access frequency, state hierarchy, and combined characteristics respectively. Experimental results on the real-world datasets like Snort, Clam AV, and URL show that the storage space of Hybrid AC is reduced to less than 5% of the space cost by the advanced AC automata. Furthermore, Hybrid FA based on combined characteristics achieves the superior performance on matching speed and robustness comparing to other proposed algorithms.

关 键 词:多模式串匹配 空间优化 高级AC自动机 统计策略 节点完全化 

分 类 号:TP301.1[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象