基于奇异值分解的英文文本检索算法  被引量:3

English Texts Retrieval Algorithm Based on SVD

在线阅读下载全文

作  者:高仕龙[1] 

机构地区:[1]乐山师范学院数学系,四川乐山614000

出  处:《计算机工程》2011年第1期78-80,共3页Computer Engineering

基  金:四川省教育厅基金资助项目“基于混沌系统的线性调频信号检测与参数估计”(09ZB026)

摘  要:提出一种英文文本检索算法,从文本中提取关键词项,根据转移概率计算出关键词项的状态矩阵,并通过奇异值分解,提取第一奇异值向量作为复特征向量,利用向量间的余弦相似度作为文本检索的相似度度量。实验结果表明,该算法在检索准确率和运算效率上都优于传统的LSA算法。A new retrieval algorithm for English texts is proposed. Keywords are extracted from the English texts. The state matrix of keywo(ds is calculated based on transition probabilities matrix and the first singular value vector is got through Singular Value Decomposition(SVD) as the complex feature vectors. The cosine similarity of texts is used to~ measure the similarity between the query and documents. Experimental results indicate that this algorithm gets the advantage over the traditional LSA algorithm in precision and computational efficiency.

关 键 词:文本检索 转移概率 奇异值分解 状态矩阵 

分 类 号:TP391.4[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象