检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]国网电力科学研究院信息与通信研究所,江苏南京210003 [2]国家电网公司信息化工作部,北京100031
出 处:《电力信息化》2011年第7期15-18,共4页Electric Power Information Technology
摘 要:防止敏感重要的文档资料泄漏是电力行业信息安全中一项重要的工作。采用二叉排序树技术对基础词组库和过滤关键字进行预排序,采用最大后缀匹配方式对需要检测的文本字符串进行中文分词,再通过关键字二叉排序树进行检查过滤,以达到安全高效检测敏感关键字的目的。经性能分析测试,该技术在性能和准确率上都有很好的效果。To avoid the information leakages of sensitive and important documents is one of important tasks for information security of electricity industry. This paper presents a keyword filtering method based on binary sort tree and Chinese word segmentation. The proposed method first uses binary sort tree to sort basic phrases and filtering keywords, and then implements the Chinese word segmentation by applying the postfix maximum match algorithm to the candidate Chinese texts, further checks sensitive keywords by using keyword binary sort tree. The experimental results show that the proposed method has a very good effect on performance and accuracy.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222