检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]上海大学图书馆,上海200444
出 处:《情报杂志》2011年第12期154-156,153,共4页Journal of Intelligence
基 金:上海市教委优青科研专项"国外主流图书馆学情报学主题词表分析对比"(编号:B.37-0501-09-001)阶段性研究成果
摘 要:以文献数据库为应用环境,提出一种基于叙词表的K-means文本聚类方法,该方法的核心思想为:首先,利用叙词表的概念分类体系,将文档集文本的特征词进行归类,形成k个聚类簇,并以此确定k个初始聚类中心;其次,在前面工作的基础上进行K-means聚类运算,直至标准函数收敛,聚类结果生成。实证分析结果显示此方法聚类效果良好。This paper proposes a text clustering algorithm of K-Means based on thesaus with the documcnt database as the applicauotn environment. The core of this algorithm is that: classify the characteristic wortis of the text documents collection by using the concept classification system of thesanrus to form K clusters and select K initial cluster centers,then carry out the K-Meand algorithm badrf on it until the standard function is convergent. The empirical results show that the clustering effect of this algorithm is better.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145