一种基于类别的混合型文本特征降维  被引量:1

A Mixed Text Reducing Feature Method Based on Sort

在线阅读下载全文

作  者:刘海峰[1] 刘守生[1] 姚泽清[1] 

机构地区:[1]解放军理工大学理学院,江苏南京210007

出  处:《微电子学与计算机》2010年第10期13-17,共5页Microelectronics & Computer

基  金:国家自然科学基金项目(70571087)

摘  要:提出了一种基于特征选择和特征抽取的混合型文本特征降维方法.通过一种改进的优势率方法进行初次特征选择,将文本表示为以类别属性为行向量的矩阵形式;再使用一种改进的最大散度差特征抽取方法进行二次特征抽取.在最大限度减少信息损失的前提下实现了文本特征的二次降维.对中文文本的分类实验结果表明,提出的特征降维方法具有良好的分类效果.This paper presents a mixed method of reducing the text features which based on the feature selection and the feature extraction.Firstly,we carry out the first selection through improving on the odds radio.The text is expressed with the matrix vector which composes of sort attributes.Then,we use an improved scatter difference to extract the features again.In the condition of the least information lost,we have completed the text feature reduction twice.The result which based on the Chinese text categorization shows that this method has a better precision in the text categorization.

关 键 词:文本分类 特征选择 特征抽取 特征降维 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象