检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]燕山大学 信息工程学院 河北 秦皇岛 066004 [2]中国科学院 软件研究所中文信息中心
出 处:《计算机工程与设计》2004年第12期2231-2233,2290,共4页Computer Engineering and Design
摘 要:为了帮助Web用户从搜索引擎所返回的大量文档片断中筛选出自己所需要的文档,在对聚类过程研究分析的基础上给出了一种Web检索结果快速聚类方法。它通过分析聚类过程,从建立索引模型、相似性的计算到聚类结果的形成等环节,都做了分析和简化,并利用检索结果的标题、Url以及文档片断3部分所含信息计算返回结果之间的相似度,将首先返回的部分检索结果利用无向图映射法进行部分聚类后,将其余返回结果分配到与之最相近的集簇中最终形成聚类结果。该方法实现简单。实验证明该方法响应速度快,聚类相关性较高,空间占用少。To help web users to choose the wanted documents from large number of snippets returned by search engine, a fast clustering method is provided based on snippets after researching and analyzing the clustering progress. From the building index model, calculating the similarities to clustering the snippets, they are all analysed and simplified. The similarity is calculated by the content of snippets' title, url and abstract. Snippets and their similaryties are mapped to an undirected graph, the part of the first returned snippets and their similarities form the clusters relying on the graph at first, and then the others are assigned to the closest cluster. Experiment shows that the method is easy to compliment and it has a good performance on running-speed, clustering quality and occupated-space.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.190.156.78