检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:庞观松[1] 张黎莎[1] 蒋盛益[1] 邝丽敏[1] 吴美玲[1]
机构地区:[1]广东外语外贸大学信息学院,广东广州510420
出 处:《山东大学学报(理学版)》2010年第7期39-44,49,共7页Journal of Shandong University(Natural Science)
基 金:国家自然科学基金资助项目(60673191);广东省高等学校自然科学研究重点项目(06Z012);广东省自然科学基金资助项目(9151026005000002)
摘 要:对检索结果聚类可以方便用户快速浏览搜索引擎返回结果。为了提取主题表达能力和可读性强的类别标签,获取高质量的聚类结果,提出基于名词短语的检索结果多层聚类方法:提取名词短语作为候选类别标签,根据候选类别标签分布情况生成基础类,再使用具有线性时间复杂度的一趟聚类算法对基础类进行多层聚类。与基于命名实体的方法、STC和Lingo算法的对比实验表明:提出方法在类别标签的可读性、有效性以及聚类性能上都优于以上3种方法。Clustering search results can facilitate users to browsing the results quickly.In order to select much informative,readable cluster labels and get high qualitative clustering results,a multi-level clustering approach based on noun phrases(MCNP) was proposed for search results.Firstly,select noun phrases as candidate cluster labels and generates basic clusters based on the distribution of candidate cluster labels.Secondly,proceed multi-level clustering on basic clusters using a one pass clustering algorithm with linear time complexity.Finally,comparative study was carried out with name entities based method,STC and Lingo search results clustering algorithms,and the results demonstrated that our approach could get much more informative,readable cluster labels and was more effective than the above three methods.
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.80