一种分类数据的聚类算法  被引量:1

A Clustering Algorithm for Categorical Data

在线阅读下载全文

作  者:谢坤武[1] 陈世强[1] 

机构地区:[1]湖北民族学院信息工程学院,恩施,445000 湖北民族学院信息工程学院,恩施,445000

出  处:《计算机研究与发展》2006年第z3期332-337,共6页Journal of Computer Research and Development

基  金:湖北省科技攻关计划基金项目(2004AA210B01)

摘  要:现有的针对分类数据的算法需要多次扫描数据库,对于数据开采经常处理的大容量数据,多遍I/O操作是一项沉重的系统开销.CACD(clustering algorithm for categoricaldata)是针对分类属性数据的聚类算法,该算法采用压缩技术缩小需要处理的数据量以提高效率,同时算法提出了一种新的基于压缩数据结构的标准用于衡量分类数据的相似度.CACD只需扫描数据库一遍,算法理论分析和实验分析都表明该算法比同类针对分类数据的聚类算法效率要高,并且压缩技术对聚类结果的质量影响不大.

关 键 词:数据开采 聚类算法 分类数据 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象