结合特征和非特征信息改进Nave Bayes及其应用  被引量:2

Improved Nave Bayes combining feature with noncharacteristic information and its application

在线阅读下载全文

作  者:赵静[1] 刘培玉[1] 陈孝礼[1] 

机构地区:[1]山东师范大学信息科学与工程学院,济南250014

出  处:《计算机应用研究》2011年第2期514-516,共3页Application Research of Computers

基  金:国家自然科学基金资助项目(60873247);山东省高新自主创新专项工程(2008ZZ28);山东省自然科学基金重点资助项目(ZR2009GZ007)

摘  要:朴素贝叶斯算法是一种常见的基于内容的垃圾邮件过滤算法,但是,传统朴素贝叶斯过滤存在判断内容的不确定性和邮件表示不完整性等问题。分析邮件信头各域在正常邮件和垃圾邮件中表现出的不同属性,提取非特征信息,结合特征信息和非特征信息改进朴素贝叶斯算法。实验结果表明,改进的朴素贝叶斯分类方法与单纯使用特征信息的方法相比,垃圾邮件的召回率和准确率更高,凸显了该方法涵盖邮件信息、克服内容判断缺陷的优势。Nave Bayes algorithm was widely used in the content-based filtering,but traditional Nave Bayes faced many problems,such as the uncertainty of classifying e-mails by analyzing e-mail content,the incompleteness of e-mail representation.In order to overcome these shortcomings,this paper analyzed different attributes between ham e-mail header and spam e-mail header,extracted noncharacteristic information,and improved Nave Bayes algorithm which combined feature information with noncharacteristic information.Experimental results show that the improved Nave Bayes classification approach increases the recall and the precision of spam,covers e-mail information,and makes up for the shortage of content-based filtering,compared with that of only using feature information.

关 键 词:邮件过滤 非特征信息 特征信息 朴素贝叶斯算法 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象