一种基于隐含子类信息的粗糙集中文文本分类方法被引量：1

A Chinese Text Classification Method Using Implied Sub-class Information and Rough Set

出　　处：《计算机科学》2008年第2期147-149,共3页Computer Science

基　　金：2006年博士学科点专项科研基金(20060247039);国家自然科学基金(60475019)的资助

摘　　要：中文文本分类是中文信息检索和Web挖掘等领域的研究热点。现有的一些分类方法在特征选择阶段存在不足,忽略了隐含的子类信息。本文提出了一种提升隐含子类的关键词权值的方法,从而可以发现有价值的子类信息,进而使用粗糙集构建分类器。实验结果表明这种方法在不增加待约简词汇数量的情况下有效地提高了文本分类的查全率。Chinese Text Classification is a hot area of Information Retrieval and Web Mining. Existing methods have some defect in the phase of Feature Selection. They ignore the hidden sub-class information. This paper suggests a method to enhance the weight of key words of hidden sub-classes, so that we can discover valuable information of sub- classes, then we use Rough Set to construct classifier. The result of the experiment indicates that this method can ef~ fectively improve the recall of text classification, without increase the amount of words need reduction.

关键词：中文信息处理粗糙集文本分类向量空间模型

分类号：TP391.12[自动化与计算机技术—计算机应用技术] G254.11[自动化与计算机技术—计算机科学与技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

一种基于隐含子类信息的粗糙集中文文本分类方法被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

一种基于隐含子类信息的粗糙集中文文本分类方法 被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

一种基于隐含子类信息的粗糙集中文文本分类方法被引量：1