一种适合中文的多模式匹配算法  被引量:4

Multiple Pattern Algorithm for Chinese

在线阅读下载全文

作  者:侯整风[1] 杨波[1] 朱晓玲[1] 

机构地区:[1]合肥工业大学计算机与信息学院,合肥230009

出  处:《计算机科学》2013年第11期117-121,共5页Computer Science

基  金:安徽省自然科学基金(090412051);广东省教育部产学研结合项目(2008B0905002400)资助

摘  要:中文字符的相互独立性导致AC算法的时空性能急剧下降。针对此问题,对AC算法的存储结构进行了改进,提出了一种适合中文的多模式匹配算法———AC_SC算法。该算法以邻接链表存储有限状态自动机,尝试解决存储空间快速膨胀问题,并将状态"0"的长链表转化为散列链表,以提高算法的匹配效率。实验结果表明,AC_SC算法具有良好的时空性能。Because of the independent of the Chinese characters, the space and time performances of AC algorithm de- cline sharply. For this problem,the storage structure of AC algorithm was improved and a multi-pattern algorithm for Chinese named AC_SC was proposed. The algorithm uses adjacency-list to store the finite state automata to solve the problem of the storage space rapid expansion. Besides, the long linked list of the state '0' is changed into a Hash linked table to improve the matching efficient. Experimental results show that AC_SC has better time and space performances.

关 键 词:多模式匹配 AC算法 邻接链表 有限状态自动机 

分 类 号:TP393.08[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象