检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]哈尔滨工业大学计算机网络与信息安全技术研究中心,哈尔滨150001
出 处:《哈尔滨工业大学学报》2007年第12期1925-1929,共5页Journal of Harbin Institute of Technology
基 金:国家自然科学基金资助项目(60203021)
摘 要:在基于有限状态自动机的多模式匹配算法(DFSA算法)基础上,结合Tuned BM算法的优点,提出一个快速的多模式字符串匹配算法,实现了多模式匹配过程中不匹配字符的连续跳跃.在此基础上进一步改进,得到一个最差时间复杂度为线性的匹配算法.分析指出算法实际比较的字符数随着模式串长度的增加而下降,并随模式集的增大有所增多.实验表明,在模式串较短时,算法需要的匹配时间仅为AC算法的1/2到1/3,AQR算法的9/10左右;在模式串较长时,所需时间为AC算法的1/4至1/8,AQR算法的3/4左右.Combined with the advantages of the Tuned Boyer - Moore algorithm, an effective algorithm for performing multiple patterns matching in a string was put forward on the concept of deterministic finite state automata (DFSA), and achieved better performance by shifting unmatched characters consecutively. Experimental results indicate that, to search a string, the algorithm takes only 1/2 - 1/3 that of AC and 9/10 of AQR in case of short patterns while the ratio is 1/4 - 1/8 and 3/4 in case of long patterns.
关 键 词:字符串匹配 有限状态自动机 TunedBM算法 多模式匹配 时间复杂度
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.83