基于词汇链的中文变异垃圾短信文本语义识别  被引量:3

Semantic recognition of altered Chinese junk short messages based on lexical chain

在线阅读下载全文

作  者:刘金岭[1] 冯万利[1] 高丽[1] 

机构地区:[1]淮阴工学院计算机工程学院,江苏淮安223003

出  处:《计算机工程与应用》2012年第19期135-139,共5页Computer Engineering and Applications

基  金:淮安科技计划项目(No.HAG09061);淮阴工学院重点基金项目(No.HGA0907)

摘  要:提出一种基于词汇链的判断变异垃圾短信方法。该方法通过构造多条词汇链来表达短信文本的叙事线索,再从多条词汇链中抽取出富含内容信息的词汇链,同时消除了多个关键词序列表达同一内容信息的冗余;将构造的词汇链作为短信文本的信息相互进行比较,以对变异的垃圾短信信息进行识别。实验结果表明,该方法能较准确地识别垃圾短信的变异信息。An algorithm for recognition of altered Chinese junk short message based on lexical chain is proposed. By constructing lexical chains for each short message text, the multiple depiction clews can be conveyed, and some strong lexical chains with high quality can be extracted to represent main content, and can remove redundancy that different keyword sequence reflects same meanings. It compares the lexical chains constructed to determine the vari- ation of junk short messages. Experimental results show that this approach can identify the variation of junk short messages more accurately.

关 键 词:词汇链 垃圾短信 变异 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象