检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]上海交通大学,上海200030
出 处:《计算机技术与发展》2008年第4期202-205,共4页Computer Technology and Development
摘 要:电子邮件作为互联网技术发展的产物,在给全球网民带来通讯便利的同时,正不可避免地遭遇有悖初衷的运用。最为突出的是随之产生的垃圾邮件像瘟疫一样蔓延,污染网络环境,占用大量传输、存储和运算资源,影响了网络的正常运行。垃圾邮件问题日益严重,受到研究人员的广泛关注。基于内容的过滤是当前解决垃圾邮件问题的主流技术之一。由于常用的特征字串匹配技术对垃圾邮件件的查准率已经不能满足日益提高的过滤系统用户的产品需求,随后引入邻近类别分类的方法,利用基于贝叶斯算法的电子邮件过滤系统,对色情垃圾邮件样本进行分析,可明显提高对垃圾邮件的查准率。As the product of Intemet technology, Email can provide convenient communication. On the other hand, some applications rehted to Entail cause big trouble to the Internet. For example, the spam spreads like plague, polluting the net environment, occupying resources for transmission, storatlon and calculation, and influencing the normal operation of network. The volume of junk Email in Internet has grown tremendously in the past few years. And this problem attracts many researchers' attention. Because the finding spam on feature word matching technique can not satisfy the developing requirements of filtering system user. Referred the vicinity category classi-fication to the Email filtering system that based on the Bayesian can filter pornographic counteraction and spare related to advertisement. Till this time,has sane test results which showed the high call ration to pornographic spam.
关 键 词:垃圾邮件 文本分类 贝叶斯算法 特征字串匹配 邻近类别分类
分 类 号:TP393.08[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249