概念语义生成与文本特征选择研究  被引量:2

Research on concept semantic space and text feature selection

在线阅读下载全文

作  者:孙福振[1] 李贞双[2] 

机构地区:[1]山东理工大学计算机科学与技术学院,山东淄博255049 [2]南阳师范学院计算机与信息技术系,河南南阳473061

出  处:《计算机工程与应用》2011年第30期116-118,共3页Computer Engineering and Applications

基  金:国家自然科学基金No.61003168;河南省重大科技攻关基金(No.092102110274)~~

摘  要:文本特征选择是文本分类和信息提取的关键技术。针对文本分类中特征向量的高维稀疏问题,提出了非负矩阵分解和概念语义空间结合的特征抽取方法,对特征矩阵分解算法加入非负限制能够给出概念语义向量面向主题的解释,较好体现文本的局部特征。采用非负矩阵分解对全局和局部语义空间进行降维处理提高了体征提取效率,对不同概念语义空间中文本分类效果比对分析。实验结果表明基于非负矩阵分解的局部概念语义空间中文本分类精度较高。Text feature selection is a key technology of text classification and information extraction.For text classification with high dimensional sparse feature vector problem,a feature extraction method based on non-negative matrix factorization and concept semantic space is presented.This method gives the interpretation of the theme and better reflects the local characteristics of the text by adding the non-negative limitation to the matrix factorization.Experimental results show higher accuracy of the classification is achieved in local semantic space.

关 键 词:概念语义空间 文本特征选择 非负矩阵分解 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象