网络检索结果聚类研究综述  被引量:2

Research Review of Network Search Results Clustering

在线阅读下载全文

作  者:柏晗[1] 成颖[1] 柯青[1] 

机构地区:[1]南京大学信息管理学院,江苏南京210023

出  处:《情报理论与实践》2015年第10期138-144,共7页Information Studies:Theory & Application

基  金:国家社会科学基金重大招标项目"面向学科领域的网络信息资源深度聚合与服务研究"(项目编号:12&ZD221);中国科学技术信息研究所"大数据环境下的人机交互研究"课题的资助

摘  要:网络检索结果聚类是将搜索引擎的检索结果聚类为有意义的类别,并赋予标签描述,以便用户快速获得所需信息的技术。文章根据网络检索结果聚类算法的改进方向将其分为面向经典和面向标签的聚类算法两类。前者的改进主要有优化特征选择、优化聚类数K以及生成重叠聚类等;后者的改进主要有优化类计分运算、优化类合并运算、数据结构优化、候选标签选择以及基于语义的优化等。在对相关研究进行综述的基础上探讨了检索结果聚类面临的问题和未来的发展方向。By clustering search results into meaningful clusters and giving the appropriate description labels,network search results clustering is used to help to get the information quickly. Based on the improving direction of network search results clustering algorithm,this paper divides the algorithm into classical clustering oriented algorithm and label-oriented algorithm. The improvement of classical clustering oriented algorithm mainly includes optimization of feature selection,optimization of cluster number K and generation of overlapping clustering. The improvement of label-oriented algorithm mainly includes optimization of class scoring operation,optimization of class merging operation,optimization of data structure,selection of candidate label and optimization based on semantics. On the basis of the review of relevant studies,the paper discusses the existing problems and future developing directions of search results clustering.

关 键 词:检索结果聚类 检索算法 优化 综述 

分 类 号:G252.7[文化科学—图书馆学] G353.1

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象