一种基于命名实体的搜索结果聚类算法  被引量:6

Search Results Clustering Algorithm Based on Named Entities

在线阅读下载全文

作  者:陈永超[1] 刘贵全[1] 

机构地区:[1]中国科学技术大学计算机科学技术系,合肥230027

出  处:《计算机工程》2009年第7期46-48,共3页Computer Engineering

摘  要:针对现有搜索结果聚类方法中形成的聚类标签可读性比较差的情况,提出一种基于命名实体的搜索结果聚类方法——NEC。命名实体作为文本中的基本信息元素,具有一定的实际意义,表征主题的能力比一般词语更强,也更具可读性。算法以搜索结果文档中存在的命名实体作为聚类的标签,经过一定的标签选择和聚类合并策略,形成最终的聚类结果,提高聚类标签的可读性。实验证明,该方法是一种可行的搜索结果聚类方法。A new way of clustering the search results based on named entities NEC is introduced. This paper proposes an algorithm which improves the readability of the cluster labels. Named entities all have certain meanings with themselves, can indicate themes of the documents which they are in, and more readable for the users. It uses the named entities in the documents as cluster labels, and gets the final result after label-selecting and cluster-merging strategies. Experiments show that it is a feasible way for search results clustering.

关 键 词:命名实体 搜索结果聚类 索引 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象