检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:杨宇环 张开生[2] YANG Yu-huan;ZHANG Kai-sheng(Information Department of the Library, Shaanxi University of Science & Technology, Xi′an 710021,China;School of Electrical and Control Engineering, Shaanxi University of Science & Technology, Xi′an 710021,China)
机构地区:[1]陕西科技大学图书馆信息部,陕西西安710021 [2]陕西科技大学电气与控制工程学院,陕西西安710021
出 处:《陕西科技大学学报》2022年第4期178-182,共5页Journal of Shaanxi University of Science & Technology
基 金:陕西科技大学校级自选科研项目(ZX14-25)。
摘 要:为了提升文本信息检索的正确率及检索效率,增强读者的阅读体验,研究一种基于特征聚类的文本信息检索算法.首先采用PCA技术对高维文本信息进行降维处理,去除复杂文本信息中的冗余数据.然后采用改进K-Means算法对降维文本信息进行聚类.采用检索准确率及检索时间两种算法评价指标,分别与多种算法进行对比分析.结果显示,检索时间分别降低13.3%和25.7%,检索准确率也得到一定程度的提高.In order to improve the accuracy and efficiency of text information retrieval and enhance readers′reading experience.A text information retrieval algorithm based on feature clustering is studied.Firstly,PCA technology is used to reduce the dimension of high-dimensional text information to remove the redundant data in complex text information.Then the improved K-Means algorithm is used to cluster the reduced dimension text information.The two evaluation indexes of retrieval accuracy and retrieval time are used to compare and analyze with various algorithms.The results show that the retrieval time is reduced by 13.3%and 25.7%respectively,and the retrieval accuracy is also improved to a certain extent.
关 键 词:文本信息 特征降维 特征聚类 改进K-MEANS 算法评价
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.90