检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]郑州信息工程大学
出 处:《微计算机信息》2005年第11X期156-158,共3页Control & Automation
基 金:河南省教育厅基金(编号:sp200303099)资助项目
摘 要:本文提出一种文本过滤方法,即首先利用PCA(主成分分析)的方法进行文本特征抽取,在此基础上运用RS中决策表上的规则推理方法,发现规则并形成规则库,对于新进来文档将其条件属性与规则库里规则进行相似匹配,进行文本过滤。实验结果表明,此方法用于垃圾邮件过滤能取得很高的正确率和召回率。This paper proposed a new method for text filtering based on Rough Sets theory and PCA. First, our algorithm for feature extraction is based on principal components analysis. Then, we generated the rules which are useful to us base on the decision tables of Rough Set theory. When an unknown document was inputted, we just matched approximately the condition property of the document to these rules and remained useful information. Results show that using our method to filter out spare enjoys a very high degree of precision and recall.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.188