检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]四川警察学院计算机系,四川泸州646000 [2]西华大学数学与计算机学院,四川成都610039
出 处:《计算机应用与软件》2010年第2期121-123,共3页Computer Applications and Software
基 金:四川省青年软件创新工程项目(2007AA42)
摘 要:为了能够有效提取邮件样本集的特征及提高垃圾邮件过滤系统的性能,介绍基于N-Gram的切分算法及语言模型,在其基础上,提出了一种改进的N-Gram切分算法,给出了一种结合N-Gram语言模型的贝叶斯过滤模型。实验结果表明,提出的方法有效地提高了垃圾邮件过滤的性能。In order to extract E-mail samples' features effectively and improve the performance of spam filtering system, this paper introduces segmentation algorithm and language model based on N-Gram. Then according to that an improved N-Gram segmentation algorithm is proposed,a Bayesian filtering model integrating the N-Gram model is given as well. Experimental results show that the improved approach is effective in improving the performance of spam filtering.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.30