基于IMI-WNB算法的垃圾邮件过滤技术研究  

在线阅读下载全文

作  者:吉小鹏[1] 

机构地区:[1]南京理工大学自动化学院,江苏南京210094

出  处:《电子元器件与信息技术》2021年第11期165-167,共3页Electronic Component and Information Technology

基  金:工业和信息化部2018年工业互联网创新发展工程(面向电子行业安全技术典型应用推广项目)资助。

摘  要:工业互联网中日益发展完善的电子邮件为工作带来了极大便利,但同时也遭受着垃圾邮件的侵害,然而传统垃圾邮件过滤算法不适应工业互联网环境。针对传统垃圾邮件过滤算法对工业互联网环境的准确率和召回率较低,本文提出一种结合改进的互信息特征以及带权重的朴素贝叶斯分类的算法,完成对工业互联网垃圾邮件的过滤。该算法通过引入词频率因子和类别间差异因子来改进互信息计算,并将计算结果作为朴素贝叶斯分类的属性权重,完成对垃圾邮件的过滤。在trec06c开源数据集上进行了对比实验,实验结果表明本文提出算法比传统朴素贝叶斯分类具有更好的鲁棒性,且在垃圾邮件过滤的准确率和召回率上都显著优于传统算法,实际应用时具有更好的可行性与有效性。

关 键 词:互信息特征 词频率因子 类别间差异因子 加权朴素贝叶斯 垃圾邮件过滤 

分 类 号:TP3[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象