基于循环迭代算法改进的TFIDF方法及应用被引量：2

ON TFIDF METHOD IMPROVED BASED ON CYCLICAL ITERATION ALGORITHM AND ITS APPLICATION

机构地区：[1]华东师范大学信息科学技术学院,上海200062 [2]上海外国语大学图书馆,上海200083

出　　处：《计算机应用与软件》2012年第11期305-308,共4页Computer Applications and Software

摘　　要：文本聚类是指自动地将文本集合分组为不同的类别,应用非常广泛。研究发现,传统的TFIDF文本分类方法存在很多的不足,针对这些不足提出改进。通过使用循环迭代算法根据特征词在类内和类间的分布情况不断优化特征词的选取,获得不断改进的分类。采用支持向量机分类器对文本分类。通过对大批量的数据集测试,该算法显示出较好的特征选择效果,能够有效地提高分类精度。Text clustering refers to automatically classifying the text collection into different categories,and its application covers a wide range.However the research reveals that traditional TFIDF text classification has many deficiencies,and in this paper we propose the improvement to make up them.By using the cyclical iteration algorithm,we incessantly optimise the selection of feature words according to their distribution situation within and between categories,and obtain the continually improving classification.Support vector machine classifier is used for the text classification.Through large number of data set tests,the improved method demonstrates a better feature selection performance,which can improve the classification accuracy effectively.

关键词：TFIDF 文本聚类文本分类 VSM 支持向量机 SVM 迭代算法

分类号：TP3[自动化与计算机技术—计算机科学与技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于循环迭代算法改进的TFIDF方法及应用被引量：2

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于循环迭代算法改进的TFIDF方法及应用 被引量：2

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于循环迭代算法改进的TFIDF方法及应用被引量：2