检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《计算机应用与软件》2008年第8期178-180,228,共4页Computer Applications and Software
摘 要:对简单贝叶斯过滤方法作一些应用方面的研究工作。首先讨论了简单贝叶斯的垃圾邮件过滤,在PU1语料上实现了简单贝叶斯算法,通过不同的特征词选取方法,得到了比前人更好的结果,给出了特征数、阈值等参数和过滤效果间的关系,并得出了较优的参数设定。然后讨论了基于简单贝叶斯的中文邮件过滤,并在自己收集整理建立的中文邮件语料库上进行中文邮件过滤的实验,得出了不同于英文邮件的较优的参数设定。In this paper, we do some practical works on the application of Naive Bayesian method. First,we discuss the Naive Bayesian anti-spam filtering and realize the Naive Bayesian algorithm on PUI corpus. By different selection ways of characteristic words, we obtain a set of preferable parameters based on the elicited parameters of characteristic number, threshold value, as well as the relationship among filtering outcomes ,the experiment shows better results than those in previous issues. Second, we discuss the problem of Chinese anti-spare filtering with Naive Bayesian method. We collected many Chinese mails and created a Chinese mail corpus. Making Chinese mail filtering experiment on the Chinese mail corpus, we got a preferable parameter configuration differing from English mail.
分 类 号:TP311.56[自动化与计算机技术—计算机软件与理论] TP393.08[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222