检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:吉小鹏[1]
机构地区:[1]南京理工大学自动化学院,江苏南京210094
出 处:《电子元器件与信息技术》2021年第11期165-167,共3页Electronic Component and Information Technology
基 金:工业和信息化部2018年工业互联网创新发展工程(面向电子行业安全技术典型应用推广项目)资助。
摘 要:工业互联网中日益发展完善的电子邮件为工作带来了极大便利,但同时也遭受着垃圾邮件的侵害,然而传统垃圾邮件过滤算法不适应工业互联网环境。针对传统垃圾邮件过滤算法对工业互联网环境的准确率和召回率较低,本文提出一种结合改进的互信息特征以及带权重的朴素贝叶斯分类的算法,完成对工业互联网垃圾邮件的过滤。该算法通过引入词频率因子和类别间差异因子来改进互信息计算,并将计算结果作为朴素贝叶斯分类的属性权重,完成对垃圾邮件的过滤。在trec06c开源数据集上进行了对比实验,实验结果表明本文提出算法比传统朴素贝叶斯分类具有更好的鲁棒性,且在垃圾邮件过滤的准确率和召回率上都显著优于传统算法,实际应用时具有更好的可行性与有效性。
关 键 词:互信息特征 词频率因子 类别间差异因子 加权朴素贝叶斯 垃圾邮件过滤
分 类 号:TP3[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.248