一种改进KNN个性化邮件过滤的方法  被引量:1

A personalized E-mail classification method based on improved KNN

在线阅读下载全文

作  者:邓文韬[1] 王国胤[1] 董振兴[1] 

机构地区:[1]重庆邮电大学计算机科学与技术研究所,重庆400065

出  处:《重庆邮电大学学报(自然科学版)》2011年第6期757-760,共4页Journal of Chongqing University of Posts and Telecommunications(Natural Science Edition)

基  金:国家自然科学基金(60773113)~~

摘  要:针对个性化邮件过滤中接收的邮件没有规律、正常邮件和垃圾邮件存在严重类偏移等问题,提出一种改进的k最近邻(k-nearest neighbor algorithm,KNN)个性化邮件过滤方法。该方法主要是通过建立兴趣度模型(对兴趣度计算的改进,剔除用户习惯对建立兴趣度模型带来的影响)不断改变训练集,使得训练集中的文本始终代表用户最近的兴趣。然后通过对接收邮件的无规律和类偏移问题的研究,提出一种改进的KNN算法,该算法主要是对文本在聚类中的价值重新评定,使其对邮件文本进行了较好的分类。经实际验证,改进后的KNN个性化过滤方法能较好地实现对邮件进行个性化分类。Regarding such traits as irregularity of receiving the emails and imbalance between email category and the quantity, the thesis puts forward a personalized improved KNN algorithm of filtering the emails. Improving the counting method on interests and removing the influence of the users' habits on the establishment of interest model, the method perfects KNN algorithm and thus achieves better classification of the emails based on the research as to the issues of category deviation. Experiments show that improved KNN filtering method could help the users classify the emails according to the users' interests much more accurately.

关 键 词:个性化 KNN算法 邮件过滤 用户兴趣 垃圾邮件 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象