几种文本分类算法性能比较与分析  被引量:2

Performance Comparison and Analysis of Several Text Classification Algorithms

在线阅读下载全文

作  者:杨娟[1] 王未央[1] YANG Juan WANG Wei-yang(College of Information Engineering, Shanghai Maritime Univeristy, Shanghai 201306)

机构地区:[1]上海海事大学信息工程学院,上海201306

出  处:《现代计算机》2016年第17期12-16,共5页Modern Computer

摘  要:针对常用的文本分类算法,给定五种文本类型的数据集,通过使用典型的文本分类算法进行实验分析,通过精确率、召回率和测试值的精度来评估这些文本分类器的性能,并给出分析结果和改进的组合训练方法。结果表明:将半监督学习训练和监督学习相结合能达到更好的分类效果。为了提高文本推荐速度,前期工作就是要选择合适的分类算法方法,组合选择算法,提高准确度和效率。Analyzes several typical text classification algorithms, gives five types of text data sets, the classic text categorization algorithm test com-parison by precision, recall accuracy rate and test value to evaluate the performance of the text classifier, and gives the analysis result and the improved combination training method. The results show that the combination of semi supervised learning training and supervised learning can achieve better classification results. In order to improve the speed of text recommendation, the preliminary work is to choose the appropriate classification algorithm, combine selection algorithm to improve the accuracy and efficiency.

关 键 词:文本分类 监督学习 组合选择 推荐 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象