基于成对约束的主动半监督文本聚类  被引量:4

Active Semi-supervised Text Clustering Based on Pairwise Constraints

在线阅读下载全文

作  者:钟将[1] 刘龙海[1] 梁传伟[2] 

机构地区:[1]重庆大学计算机学院,重庆400044 [2]山东省莱州市国家税务局信息中心,山东莱州261400

出  处:《计算机工程》2011年第13期183-186,共4页Computer Engineering

基  金:国家科技支撑计划基金资助重大项目(2008BAH37B04);重庆市自然科学基金资助项目(CSTC2010BB2046;CSTC2009BB2184);"211工程"三期建设基金资助项目(S-10218)

摘  要:在主动选取成对约束方法的基础上,提出一种基于成对约束的主动半监督文本聚类方法。利用潜在语义索引方法对文本特征空间进行降维,在聚类过程中,采用构造的约束选取方法主动地选取成对约束信息,并利用选取的成对约束信息指导文本聚类。实验结果表明,该方法能利用少量的监督信息提高文本聚类的分类准确率。An active method which can effectively select pairwise constraints is constructed.By using this method,an active semi-supervised text clustering method based on pairwise constraints is proposed.Latent Semantic Index(LSI) is used to reduce the dimension of text features.In the clustering process,it uses the proposed method to actively select pairwise constraints,and then uses these pairwise constraints to steer the clustering process towards an appropriate partition.Experimental results show that the proposed method can effectively improve the text clustering results by using a small amount of pairwise constraints

关 键 词:文本聚类 半监督聚类 潜在语义索引 成对约束 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象