互联网中非法文本特征分析及其属性预选取新方法  被引量:7

Analysis of Illegitimate Contents in Web and a New Feature Pre-selection Method

在线阅读下载全文

作  者:张永奎[1] 李东艳[1] 

机构地区:[1]山西大学计算机科学系,山西太原030006

出  处:《计算机应用》2004年第4期113-115,共3页journal of Computer Applications

基  金:山西省回国留学人员基金(2002004)

摘  要:针对互联网中含不良内容的文本带来的信息安全问题,分析总结它们出现的特征,结合内容过滤技术,提出对此类文本的预处理方法,即带标点符号属性预选取方法。方法充分利用此类信息中词出现的特征,在属性预选取中,将标点符号作为潜在特征词的触发信息,进行文本预选属性集的提取。实验结果表明,该方法对增加合法文本与非法文本的区分度有较明显的效果。Contents containing ill information in Web have brought new problems to information security. Using content filter technology,a new feature pre-selection method has been put forward for farther feature selection. Considering the format of the word in the contents,the method uses punctuations as the trigger extracting the latent word. Results show that the method has prominent effect in differentiating legit and illegitimate content.

关 键 词:内容过滤 信息安全 非法文本 属性预选取 

分 类 号:TP393.08[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象