检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]江南大学信息工程学院 [2]中科院自动化研究所模式识别国家重点实验室,北京100080
出 处:《计算机科学与探索》2007年第3期331-339,共9页Journal of Frontiers of Computer Science and Technology
基 金:the National Laboratory of Pattern Recognition;Institute of Automation;Chinese Academy of Sciences(中科院自动化研究所模 式识别国家重点实验室基金资助).
摘 要:提出了一种基于极大熵理论的球面K均值文本聚类算法ME-SPKM。该算法利用了传统文本聚类算法SPKmeans中使用的余弦相似度度量,进而引入极大熵理论构造了适合文本聚类的极大熵目标函数。对文本数据的实验证明了极大熵球面K均值文本聚类算法取得了比传统文本聚类算法更好的聚类效果。A maximum-entropy version of the spherical K-means document clustering algorithm ME-SPKM is presented based on the well-known maximum-entropy. The proposed method uses the cosine similarity which is adopted by the typical text clustering algorithm SPKmeans,then constructs a maximum-entropy-based objective function. Experimental results demonstrate that the maximum-entropy spherical K-means ME-SPKM can achieve better clustering results than traditional clustering approaches in text clustering.
关 键 词:极大熵 球面 均值 文本聚类 聚类分析 聚类算法 熵理论 相似度度量 文本数据 算法利用 目标函数 理论构造 聚类效果 证明 实验
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15