一种半监督K均值多关系数据聚类算法  被引量:22

Semi-Supervised K-Means Clustering Algorithm for Multi-Type Relational Data

在线阅读下载全文

作  者:高滢[1,2] 刘大有[1,2] 齐红[1,2] 刘赫[1,2] 

机构地区:[1]吉林大学计算机科学与技术学院,吉林长春130012 [2]吉林大学符号计算与知识工程教育部重点实验室,吉林长春130012

出  处:《软件学报》2008年第11期2814-2821,共8页Journal of Software

基  金:Supported by the National Natural Science Foundation of China under Grant Nos.60496321;60773099;60573073(国家自然科学基金);the National High-Tech Research and Development Plan of China under Grant Nos.2006AA10Z244 2006AA10A309(国家高技术研究发展计划(863));the Science and Technology Development Plan of Jilin Province of China under Grant No.20030523(吉林省科技发展计划);the European Commission under Grant No.TH/Asia Link/010(111084)(欧盟项目)

摘  要:提出了一种半监督K均值多关系数据聚类算法.该算法在K均值聚类算法的基础上扩展了其初始类簇的选择方法和对象相似性度量方法,以用于多关系数据的半监督学习.为了获取高性能,该算法在聚类过程中充分利用了标记数据、对象属性及各种关系信息.多关系数据库Movie上的实验结果验证了该算法的有效性.A semi-supervised K-means clustering algorithm for multi-type relational data is proposed, which extends traditional K-means clustering by new methods of selecting initial clusters and similarity measures, so that it can semi-supervise cluster multi-type relational data. In order to achieve high performance, in the algorithm, besides attribute information, both labeled data and relationship information are employed. Experimental results on Movie database show the effectiveness of this method.

关 键 词:数据挖掘 半监督学习 聚类算法 多关系数据 K均值聚类 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象