基于二叉排序树及中文分词的关键字过滤技术  

Research on Keyword Filtering Technology Based on Binary Sort Tree and Chinese Word Segmentation

在线阅读下载全文

作  者:叶敏[1] 范金锋[2] 

机构地区:[1]国网电力科学研究院信息与通信研究所,江苏南京210003 [2]国家电网公司信息化工作部,北京100031

出  处:《电力信息化》2011年第7期15-18,共4页Electric Power Information Technology

摘  要:防止敏感重要的文档资料泄漏是电力行业信息安全中一项重要的工作。采用二叉排序树技术对基础词组库和过滤关键字进行预排序,采用最大后缀匹配方式对需要检测的文本字符串进行中文分词,再通过关键字二叉排序树进行检查过滤,以达到安全高效检测敏感关键字的目的。经性能分析测试,该技术在性能和准确率上都有很好的效果。To avoid the information leakages of sensitive and important documents is one of important tasks for information security of electricity industry. This paper presents a keyword filtering method based on binary sort tree and Chinese word segmentation. The proposed method first uses binary sort tree to sort basic phrases and filtering keywords, and then implements the Chinese word segmentation by applying the postfix maximum match algorithm to the candidate Chinese texts, further checks sensitive keywords by using keyword binary sort tree. The experimental results show that the proposed method has a very good effect on performance and accuracy.

关 键 词:二叉排序 中文分词 关键字过滤 信息安全 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象