基于相对密度的多耦合文本聚类算法  被引量:2

Multi-coupled text clustering algorithm based on relative density

在线阅读下载全文

作  者:王洪佳[1] 邢长征[1] 王星[1] 

机构地区:[1]辽宁工程技术大学电子与信息工程学院,辽宁葫芦岛125105

出  处:《计算机应用研究》2016年第6期1624-1627,共4页Application Research of Computers

基  金:国家自然科学基金资助项目(61402212)

摘  要:针对现有的空间向量模型在进行文本表示时忽略词条的位置和词条间关系的问题,提出了一种基于相对密度的多耦合文本聚类算法。在基于相对密度的聚类方法基础上,该算法根据相对密度越小文本相似性越小这一事实,将相对密度转换为文本相似度,融入了传统DBSCAN密度算法,并对核心对象的选取进行了优化。实验结果表明,与改进的K-means文本聚类和改进的DBSCAN文本聚类算法相比,本算法在文本聚类中更高效、聚类质量更优。Aiming at the problem that existing space vector models ignore entry location and the relations between entries,this paper proposed a multi-coupled text clustering algorithm based on relative density. On the basis of clustering algorithms based on relative density and according to the reality that the smaller the relative density was,the smaller the text similarity was,the algorithm converted relative density to text similarity,integrated the traditional DBSCAN density algorithm,and optimized the selection of core objects. Experimental results show that,comparing with the improved K-means and the improved DBSCAN text clustering algorithms,the proposed algorithm performs more efficiently and has a better clustering quality in text clustering.

关 键 词:文本聚类 空间向量模型 相对密度 文本相似度 核心对象 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术] TP301.6[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象