检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]南京航空航天大学信息科学与技术学院,江苏南京210016
出 处:《南京理工大学学报》2008年第1期78-82,共5页Journal of Nanjing University of Science and Technology
基 金:国家"863"计划(2005AA103)
摘 要:结合反垃圾邮件技术的研究,分析了电子邮件数字信息预处理中的特征选择法和将机器学习技术应用于数字信息分类器的方法。针对邮件信息特征向量庞大的问题,提出了GA-CHI特征选择法作为信息预处理,将复杂的邮件数字信息转变成易于机器学习处理的形式。基于BP神经网络电子邮件数字信息分类器,采用遗传算法来优化神经网络邮件数字信息分类器,以进一步提高对中文电子邮件的分类效果。通过对系统的实验分析表明:该文采用的方法能有效地实现对电子邮件数字信息的分类。Combined with the research on Anti-Spam technology, the feature selection algorithm in pretreatment of e-mail information and the method of applying machine learning technology to digital information classifier is analyzed. In view of the problem that mail message eigenvector is so huge, GACHI feature selection algorithm as pretreatment of information is proposed. It transforms complicated e-mail information into the form which can be easily managed by machine learning. In order to further enhance the effectiveness of Chinese e-mail classification, e-mail information classifier based on BP neural network adopts genetic algorithm to optimize itself. Experimental analysis of the system shows that the method described in the paper can effectively realize the classification of the e-mail information.
关 键 词:电子邮件分类器 特征选择 遗传算法 人工神经网络
分 类 号:TP183[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.41