基于短文本的独立语义特征抽取算法  被引量:4

Independent semantic feature extraction algorithm based on short text

在线阅读下载全文

作  者:胡佳妮[1] 郭军[1] 邓伟洪[1] 徐蔚然[1] 

机构地区:[1]北京邮电大学信息工程学院,北京100876

出  处:《通信学报》2007年第12期121-124,共4页Journal on Communications

基  金:国家自然科学基金资助项目(60475007;60675001)~~

摘  要:提出了一种基于短文本的独立语义特征抽取算法,旨在降低文本向量的稀疏性并提其高语义表示能力。该算法首先采用潜在语义分析降低文本的维数并去除噪声,然后运用独立成份分析方法在潜在语义特征中提取出最能表达语义且相互统计独立的特征。实验表明此算法优于潜在语义索引算法。An independent semantic feature extraction algorithm was proposed, aiming at reducing the sparseness of short text and enhancing its capability of semantic expression. The algorithm first makes use of latent semantic indexing to reduce the dimension and wipe off noise, and then it introduces independent component analysis to extract statistic independent and semantic features. Experimental results prove the feasibility of the algorithm and demonstrate it is superior to latent semantic indexing.

关 键 词:特征 语义 独立成份 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象