检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]国家数字交换系统工程技术研究中心,郑州450002
出 处:《计算机应用》2013年第8期2370-2374,2382,共6页journal of Computer Applications
基 金:国家科技支撑计划项目(2012BAH02B03;2012BAH02B01);国家863计划项目(2011AA01A103;2011AA01A101;2011BAH19B04)
摘 要:基于确定性有限自动机(DFA)的传统正则表达式匹配方法存在单周期处理单字符的速度瓶颈。为提升处理速率,提出一种单周期处理多字符的匹配算法MC-DFA,该算法基于DFA实现,支持匹配位置的精确定位。MC-DFA将传统DFA中的单字符跳转合并为多字符跳转,实现了单周期处理多个输入字符。通过状态转移矩阵二阶压缩算法,MC-DFA分别对矩阵行内以及行间冗余进行消除,减少了内存使用。300条规则下,单周期处理8字符时,MC-DFA吞吐率能够达到7.88 Gb/s,内存占用小于6 MB,预处理时间为19.24 s。实验结果表明,MC-DFA能够有效提升系统吞吐率,并且保证内存占用在可接受范围之内,性能优于现有正则表达式匹配算法。Traditional Deterministic Finite Automata(DFA) based regular expression matching can only process one character per cycle,which is the speed bottleneck.A new algorithm named Multi-Character DFA(MC-DFA) was proposed for high throughput matching and precise positioning.It combined the one character transition in traditional DFA together to handle multi-character processing per cycle.A new transition matrix compress algorithm was also proposed to reduce the redundancy introduced by MC-DFA.The result demonstrates that MC-DFA can improve the throughput efficiently while requiring acceptable memory.For a set of 300 regexes,8C-DFA obtains a throughput of 7.88 Gb / s,memory usage less than 6 MB and 19.24 s preprocessing time,better than traditional methods.
分 类 号:TP393[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222