基于模糊软集合理论的文本分类方法  被引量:8

Text Classification Approach Based on Fuzzy Soft Set Theory

在线阅读下载全文

作  者:洪智勇[1,2] 秦克云[1] 

机构地区:[1]西南交通大学数学学院,成都610031 [2]五邑大学计算机学院,江门529020

出  处:《计算机工程》2010年第13期90-92,共3页Computer Engineering

基  金:广东省自然科学基金资助项目(9151001003000005)

摘  要:为提高文本分类精度,提出一种基于模糊软集合理论的文本分类方法。该方法把文本训练集表示成模糊软集合表格形式,通过约简、构造软集合对照表方法找出待分类文本所属类别,并针对文本特征提取过程中由于相近特征而导致分类精度下降问题给出一种基于正则化互信息特征选择算法,有效地解决了上述问题。与传统的KNN和SVM分类算法相比,模糊软集合方法在文本分类的精度和准度上都有所提高。A text classification approach based on soft set theory is proposed to enhance the accuracy of the text classification.The text training set is mapped onto a fuzzy soft set,the category of the new text can be achieved through the reduction of soft set table and construction of the comparison table of the soft set,in order to solve the problem that classification accuracy degrades when the feature is closely related to the selected feature,this paper gives a new feature selection algorithm based on normalization mutual information feature selection algorithm.Comparing with traditional KNN and SVM classification algorithm,the fuzzy soft set approach has the improvement on classification precision and accuracy.

关 键 词:文本分类 软集合 模糊软集合 特征选择 互信息 

分 类 号:TP301[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象