极大熵球面K均值文本聚类分析  被引量:1

Maximum-entropy sphere K-means document clustering analysis

在线阅读下载全文

作  者:修宇 王士同[1] 朱林[1] 宗成庆[2] 

机构地区:[1]江南大学信息工程学院 [2]中科院自动化研究所模式识别国家重点实验室,北京100080

出  处:《计算机科学与探索》2007年第3期331-339,共9页Journal of Frontiers of Computer Science and Technology

基  金:the National Laboratory of Pattern Recognition;Institute of Automation;Chinese Academy of Sciences(中科院自动化研究所模 式识别国家重点实验室基金资助).

摘  要:提出了一种基于极大熵理论的球面K均值文本聚类算法ME-SPKM。该算法利用了传统文本聚类算法SPKmeans中使用的余弦相似度度量,进而引入极大熵理论构造了适合文本聚类的极大熵目标函数。对文本数据的实验证明了极大熵球面K均值文本聚类算法取得了比传统文本聚类算法更好的聚类效果。A maximum-entropy version of the spherical K-means document clustering algorithm ME-SPKM is presented based on the well-known maximum-entropy. The proposed method uses the cosine similarity which is adopted by the typical text clustering algorithm SPKmeans,then constructs a maximum-entropy-based objective function. Experimental results demonstrate that the maximum-entropy spherical K-means ME-SPKM can achieve better clustering results than traditional clustering approaches in text clustering.

关 键 词:极大熵 球面 均值 文本聚类 聚类分析 聚类算法 熵理论 相似度度量 文本数据 算法利用 目标函数 理论构造 聚类效果 证明 实验 

分 类 号:TP[自动化与计算机技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象