基于特征聚类的文本信息检索算法研究  被引量:3

Research on text information retrieval algorithm based on feature clustering

在线阅读下载全文

作  者:杨宇环 张开生[2] YANG Yu-huan;ZHANG Kai-sheng(Information Department of the Library, Shaanxi University of Science & Technology, Xi′an 710021,China;School of Electrical and Control Engineering, Shaanxi University of Science & Technology, Xi′an 710021,China)

机构地区:[1]陕西科技大学图书馆信息部,陕西西安710021 [2]陕西科技大学电气与控制工程学院,陕西西安710021

出  处:《陕西科技大学学报》2022年第4期178-182,共5页Journal of Shaanxi University of Science & Technology

基  金:陕西科技大学校级自选科研项目(ZX14-25)。

摘  要:为了提升文本信息检索的正确率及检索效率,增强读者的阅读体验,研究一种基于特征聚类的文本信息检索算法.首先采用PCA技术对高维文本信息进行降维处理,去除复杂文本信息中的冗余数据.然后采用改进K-Means算法对降维文本信息进行聚类.采用检索准确率及检索时间两种算法评价指标,分别与多种算法进行对比分析.结果显示,检索时间分别降低13.3%和25.7%,检索准确率也得到一定程度的提高.In order to improve the accuracy and efficiency of text information retrieval and enhance readers′reading experience.A text information retrieval algorithm based on feature clustering is studied.Firstly,PCA technology is used to reduce the dimension of high-dimensional text information to remove the redundant data in complex text information.Then the improved K-Means algorithm is used to cluster the reduced dimension text information.The two evaluation indexes of retrieval accuracy and retrieval time are used to compare and analyze with various algorithms.The results show that the retrieval time is reduced by 13.3%and 25.7%respectively,and the retrieval accuracy is also improved to a certain extent.

关 键 词:文本信息 特征降维 特征聚类 改进K-MEANS 算法评价 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象