基于蚁群遗传算法的中文文本分类中的特征提取  被引量:5

FEATURE SELECTION IN CHINESE TEXT CATEGORIZATION BASED ON ANT COLONY ALGORITHM AND GENETIC ALGORITHM

在线阅读下载全文

作  者:龙鹏飞[1] 王莹莹[1] 段焰[2] 

机构地区:[1]长沙理工大学计算机与通信工程学院,湖南长沙410076 [2]湖南工程学院计算机系,湖南湘潭411101

出  处:《计算机应用与软件》2008年第12期106-108,共3页Computer Applications and Software

基  金:湖南省科技计划资助项目(04FJ4130)

摘  要:针对文本分类中特征提取准确度的问题,分析了中文文本中词长对于表征文本类别的影响,改进了传统的中文文本词条权重计算方法;由于遗传算法用于特征提取时搜索随机性强,没有方向性,故将蚁群算法应用到遗传算法的选择操作中,提出了一种蚁群算法和遗传算法相结合的特征提取方法。实验结果表明,该方法不但可以提高分类的准确率,而且可以减少分类时间,是一种有效的方法。In view of the feature selection in text categorization, the influence on object text categories exerted by the length of Chinese phrases is analyzed, and the traditional term weighting formula is improved. Considering the strong randomness and the lack of a definite direction of Genetic Algorithm (GA) in feature selection, a new feature selection method based on GA and Ant Colony Algorithm (ACA) is proposed. The results show that the new method can improve the accuracy of categorization and reduce the categorization time.

关 键 词:文本分类 特征提取 遗传算法 蚁群算法 

分 类 号:TP391.12[自动化与计算机技术—计算机应用技术] TP391.41[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象