检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:刘德山[1]
机构地区:[1]辽宁师范大学计算机与信息技术学院,大连116081
出 处:《计算机科学》2011年第11期148-152,共5页Computer Science
基 金:辽宁省教育厅科研基金(2008366)资助
摘 要:针对现有搜索结果分类算法在聚类标签筛选、聚类质量评估及控制重叠聚类方面的缺陷,提出了一种改进的基于向量空间模型与后缀树模型的检索结果聚类算法,从而完善了LINGO算法的聚类及聚类标签打分函数,增加了基本类合并过程,改善了对中文的处理效果。最后对算法的分类效果及产生标签的质量进了实验分析,基于carrot2框架,建立了Web搜索结果聚类推荐平台。验证了CQIG算法分类的准确性和聚类标签的区分性和可读性。To make up for the deficiencies in clustering label selection,clustering quality evaluating and the control of overlapping clustering in the existing search results classification algorithm,this paper proposed an improved search results clustering algorithm based on vector space model and suffix tree model.We modified LINGO algorithm's clustering function and clustering label scoring function,basic clustering merging process was added and the treatment effect of Chinese was improved.Finally,we analyzed the algorithm's classification results and the generated label's quality according to the experiment results.What's more,a platform for recommended Web search results clustering based on carrot2 framework was established and CQIG algorithm's classification accuracy and clustering label's discriminative and readability were confirmed on this platform.
关 键 词:搜索结果聚类 后缀树模型 向量空间模型 奇异值分解
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.13