一种基于位图的多模式匹配算法  被引量:12

A multiple-pattern matching algorithm based on bitmap

在线阅读下载全文

作  者:张元竞[1] 张伟哲[1] 

机构地区:[1]哈尔滨工业大学计算机科学与技术学院,哈尔滨150001

出  处:《哈尔滨工业大学学报》2010年第2期277-280,共4页Journal of Harbin Institute of Technology

基  金:国家自然科学基金资助项目(60703014);高等学校博士学科点专项科研基金资助项目(20070213044);中国博士后科学基金资助项目(20070410263);哈尔滨工业大学优秀青年教师培养计划资助项目(HITQNJS.2007.034)

摘  要:为降低自动机类多模匹配算法的空间开销,同时仍保持较低的算法时间复杂度,提出了一种基于位图的空间优化算法.将自动机全部状态按照字典树结构的层数划分,将访问频率较低的后若干层状态对应的转移表压缩存储,并使用位图提高对被压缩信息的检索速度.经过实验和在实际应用环境中的验证,这种改进算法能够大幅降低空间开销,而匹配时间或响应时间基本不变.在模式串的数量达到万条以上规模时,实验表明优化算法能够降低25%~70%的空间消耗.In order to reduce the memory consumption of automata algorithms in the field of multi-pattern matching, this paper proposes an efficient space optimization algorithm based on bitmap. It divides all the states in the automata into two groups by their depth in the data structure"trie", and reduces the memory consumption of the deeper group that will be retrieved less. It also makes use of bitmap to improve the time efficiency of the deeper group. Our experiments show that this algorithm can sharply reduce the memory consumption, and when the number of patterns is more than the level of 10 thousand, the space consumption can be decreased by 25% -70%.

关 键 词:多模匹配 AC算法 有限状态自动机 位图 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象