检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《现代电子技术》2006年第24期55-57,共3页Modern Electronics Technique
基 金:湖北省自然科学基金(2005ABA238)资助
摘 要:为了减少将合法邮件误判为垃圾邮件的误报率及将垃圾邮件误判为合法邮件的漏报率的损失,首先基于现有的文本特征提取评估函数:期望交叉熵及互信息提出一种新的评估函数。利用此函数可提取到更具有代表性的邮件特征向量。在此之上提出一种基于贝叶斯公式可减少损失的垃圾邮件过滤方法。经过仿真测试后,发现基于新评估函数的新方法可有效降低误报率和漏报率。To minimize the cost of wrong report rate that mistake the legal mails as spare and missing report rate that mistake the spam as legal mails,flrst a new evaluation function which based on existing evaluation function of text feature extraetion; expectation cross entropy and mutual information is brought forward in this paper. Using this function,we can get more representational eigenvector from email. And then this paper presents a minimizing cost anti- spare filtering algorithm based on Bayesian. After some simulation tests, it found that new algorithm based on new evaluation function can cut down wrong report rate and missing report rate efficiently.
分 类 号:TP302.1[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.145.180.66