检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《网络安全技术与应用》2010年第6期55-57,共3页Network Security Technology & Application
基 金:湖北省自然科学基金项目(编号:2007ABA025)资助
摘 要:相似度计算的质量对于搜索引擎的速度和准确率有着很大的影响。本文提出了基于PageRank值的文本相似度改进模型(BPVSM),以PageRank值对文本分类,在计算文本相似度时考虑不同类别的信息差异。对1370条信息进行检索,用改进后的模型对检索结果进行重排序。实验表明,改进后的模型可以提高检索的准确率。The quality of text similarity has a great impact on the speed and accuracy of search engine.This paper proposes an improved similarity model of text vector space,in which the text classification is based on PageRank value,taking into account of the differences among different classification of information when calculate the similarity of vectors.This model is used to retrieve and rank the 1370 informations,the results show that the improved model can improve the accuracy of retrieval.
关 键 词:搜索引擎 PAGERANK 向量空间模型 TF/IDF
分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.202