一种基于PCA和RS的文本过滤方法  被引量:5

A Method for Text Filter Based on PCA and RS

在线阅读下载全文

作  者:林琛[1] 李弼程[1] 宋辉[1] 

机构地区:[1]郑州信息工程大学

出  处:《微计算机信息》2005年第11X期156-158,共3页Control & Automation

基  金:河南省教育厅基金(编号:sp200303099)资助项目

摘  要:本文提出一种文本过滤方法,即首先利用PCA(主成分分析)的方法进行文本特征抽取,在此基础上运用RS中决策表上的规则推理方法,发现规则并形成规则库,对于新进来文档将其条件属性与规则库里规则进行相似匹配,进行文本过滤。实验结果表明,此方法用于垃圾邮件过滤能取得很高的正确率和召回率。This paper proposed a new method for text filtering based on Rough Sets theory and PCA. First, our algorithm for feature extraction is based on principal components analysis. Then, we generated the rules which are useful to us base on the decision tables of Rough Set theory. When an unknown document was inputted, we just matched approximately the condition property of the document to these rules and remained useful information. Results show that using our method to filter out spare enjoys a very high degree of precision and recall.

关 键 词:主成分分析 粗糙集 特征抽取 文本过滤 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象