用于Web文档聚类的基于相似度的软聚类算法  被引量:6

A Similarity-based Soft Clustering Algorithm for Web Documents

在线阅读下载全文

作  者:姜亚莉[1] 关泽群[1] 

机构地区:[1]武汉大学遥感信息工程学院,武汉430079

出  处:《计算机工程》2006年第2期59-61,共3页Computer Engineering

基  金:教育部博士点基金项目(20030486045)"遥感影像数据库语义生成中的层次差别方法"

摘  要:提出了一种基于相似度的软聚类算法用于文本聚类,这是一种基于相似性度量的有效的软聚类算法,实验表明通过比较SISC和诸如K-means的硬聚类算法,SISC的聚类速度快、效率高。最后展望了文本挖掘在信息技术中的发展前景。This paper proposes similarity-based soft clustering (SlSC), an efficient soft clustering algorithm based on a given similarity measure used in document clustering. Comparison with existing hard clustering algorithlns like K-means, the experiment indicates SISC is both efficient and effective and this algorithm is available for docurnent clustering. In the end, it highlights the upcoming challenges of document mining and the opportunities it offers.

关 键 词:WEB文本挖掘 文本聚类 软聚类 相似度 

分 类 号:TP312[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象