基于重新标度的中文短信文本聚类方法  

Chinese short message text clustering using rescaling

在线阅读下载全文

作  者:刘金岭[1] 冯万利[1] 张亚红[1] 

机构地区:[1]淮阴工学院计算机工程学院,江苏淮安223003

出  处:《计算机工程与应用》2012年第21期146-150,共5页Computer Engineering and Applications

基  金:淮安科技计划项目(No.HAG09061);淮阴工学院重点基金项目(No.HGA0907)

摘  要:选择一组具有良好区分度的方向构建了CMAS坐标系,又根据初始簇的分布特性,构造出各个坐标轴的重新标度函数以提高聚类决策的有效性。其算法CMAS以迭代的方式收敛得到了最终解。CMAS算法的时间复杂度与K-Means保持在同一量级上。实验结果表明,CMAS算法有较好的聚类质量。In the clustering process of SMS text,a set of discriminative directions are chosen to construct the CMAS coordinate.The re-scaling function of axis is constructed in order to improve the effectiveness of cluster policy,according to the distribution characteristics of the initial clusters.CMAS iterative algorithm converges to the final solution.The time complexity of CMAS remains the same as K-means by using a K-means-like iteration strategy.Experimental results show that,CMAS algorithm has better clustering quality.

关 键 词:标度 中文短信 聚类 

分 类 号:TP301[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象