基于PageRank值的文本相似度改进模型  被引量:1

A improved text similarity model based on PageRank value

在线阅读下载全文

作  者:熊才权[1] 田浩[1] 

机构地区:[1]湖北工业大学计算机学院,湖北430068

出  处:《网络安全技术与应用》2010年第6期55-57,共3页Network Security Technology & Application

基  金:湖北省自然科学基金项目(编号:2007ABA025)资助

摘  要:相似度计算的质量对于搜索引擎的速度和准确率有着很大的影响。本文提出了基于PageRank值的文本相似度改进模型(BPVSM),以PageRank值对文本分类,在计算文本相似度时考虑不同类别的信息差异。对1370条信息进行检索,用改进后的模型对检索结果进行重排序。实验表明,改进后的模型可以提高检索的准确率。The quality of text similarity has a great impact on the speed and accuracy of search engine.This paper proposes an improved similarity model of text vector space,in which the text classification is based on PageRank value,taking into account of the differences among different classification of information when calculate the similarity of vectors.This model is used to retrieve and rank the 1370 informations,the results show that the improved model can improve the accuracy of retrieval.

关 键 词:搜索引擎 PAGERANK 向量空间模型 TF/IDF 

分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象