检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:刘夏[1,2,3] 刘萍[1,2] 刘燕兵[1,2] 谭建龙[1,2]
机构地区:[1]中国科学院计算技术研究所,北京100190 [2]信息安全技术国家工程实验室,北京100190 [3]中国科学院研究生院,北京100049
出 处:《计算机工程与应用》2011年第18期68-72,共5页Computer Engineering and Applications
基 金:国家重点基础研究发展规划(973)(No.2007CB311100);国家高技术研究发展计划(863)(No.2009AA01Z436)~~
摘 要:在移动终端内容安全检测中",黑名单"过滤是一种常用的手段,但有限的存储空间制约了它的应用。根据"黑名单"过滤特点研究了一种多串匹配算法的改进,以Aho-Corasick算法为例,采用两种启发式策略从不等长的URL串中提取具有代表性的、等长的模式子串,并使用双数组进一步压缩。在Nokia 5230上的测试表明,该算法的存储空间是经典AC算法的0.7%,而速度可达到95%以上。In the mobile terminals’content security monitoring,blacklist is a common way,but the limited memory restrains its application.Based on the characteristics of blacklist filtering,this paper comes up with an improvement for multiple pattern string matching algorithms.This paper uses Aho-Corasick(AC) as an example.Two heuristic strategies are applied to extract representative pattern strings of the same length from URL strings which have different lengths.Then this structure is further compressed using double-array.The experiments in Nakia 5230 show that the algorithm only consumes 0.7% of the memory compared to traditional AC,while maintaining 95% of the speed of latter.
关 键 词:移动终端 AHO-CORASICK算法 空间压缩 启发式策略 URL过滤
分 类 号:TP309[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.188.181.58