基于Fisher线性判别模型的文本特征选择算法  被引量:4

A Fisher Linear Discriminant Model-Based Text Feature Selection Algorithm

在线阅读下载全文

作  者:刘健[1] 钱猛[1] 张维明[1] 

机构地区:[1]国防科技大学信息系统与管理学院,湖南长沙410073

出  处:《国防科技大学学报》2008年第5期135-138,共4页Journal of National University of Defense Technology

基  金:国家自然科学基金资助项目(70371008)

摘  要:在采用向量空间模型表示方法的文本分类系统中,维数约简是必要的步骤,特征选择方法由于计算复杂度较低而被广泛采用。本文基于Fisher线性判别模型提出了一种新的文本特征选择算法,将其求解过程转换为一个特征项优化组合的问题,避免了复杂的矩阵变换运算。实验表明,该方法与信息增益、卡方统计方法比较,具有较明显的优势。Dimension reducing is very important in VSM based text classification system. Feature selection is more suitable for text data because of its efficiency. A new feature selection algorithm is proposed in this paper on the basis of Fisher linear discriminant model, which converts the solution process to feature optimization problem and avoids the complex matrix operations. The experiment shows that the new algorithm has good performance and is better than IG and CHI method.

关 键 词:Fisher线性判别模型 文本分类 特征选择 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象