检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:翟玲[1] 崔旭[2] ZHAI Ling;CUI Xu(Department of Library Information Technology,Xi'an University of Science and Technology,Xi'an 710054,China;School of Public Management,Northwest University,Xi'an 710027,China)
机构地区:[1]西安科技大学图书馆信息技术部,西安710054 [2]西北大学公共管理学院,西安710027
出 处:《吉林大学学报(工学版)》2022年第4期910-915,共6页Journal of Jilin University:Engineering and Technology Edition
基 金:陕西省科技计划项目(软科学研究计划立项项目)(2020KRM21);西安科技大学哲学社会科学繁荣重点项目(2020SZ04)。
摘 要:由于当前已有方法未能考虑文本信息特征提取问题,导致平均相关性、平均优异率和新词搜索准确率下降。为了有效解决上述问题,提出一种基于分段估计和PageRank的文本信息相似性搜索算法。采用分段估计法对文本特征进行提取;将PageRank取值大小作为文本信息初步分类的准则,计算文本信息不同特征的相似度,将文本信息相似度进行排序,根据文本信息间的相关性搜索相似性文本信息,有效实现了文本信息相似性搜索。仿真实验结果表明,本文算法能够全面提升平均相关性、平均优异率和新词搜索准确率,其新词搜索准确率最高值达到了98.98%。Because the current existing methods fail to consider the problem of text information feature extraction,the average relevance,average excellence rate and new word search accuracy rate decrease. In order to effectively solve the above problems,a text information similarity search algorithm based on segment estimation and PageRank is proposed. First,the segmentation estimation method is used to extract text features,and the PageRank value is taken as the criterion for preliminary classification of text information. Then,the similarity of different features of text information is calculated,the text information similarity is sorted. Finally,the similarity is searched based on the relevance between text information,effectively realizing the similarity search of text information. Simulation results show that the proposed algorithm can comprehensively improve the average correlation,average excellence rate and new word search accuracy,and the highest new word search accuracy reaches 98.98%,which indicates that the algorithm can obtain high quality and high stability search results.
关 键 词:分段估计 PAGERANK 文本信息 相似性搜索
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145