基于广义信息距离的直接聚类算法  被引量:6

A Direct Clustering Algorithm Based on Generalized Information Distance

在线阅读下载全文

作  者:丁世飞[1] 史忠植[2] 靳奉祥[3] 夏士雄[1] 

机构地区:[1]中国矿业大学计算机科学与技术学院,徐州221008 [2]中国科学院计算技术研究所智能信息处理重点实验室,北京100080 [3]山东科技大学地球信息科学与工程学院,青岛266510

出  处:《计算机研究与发展》2007年第4期674-679,共6页Journal of Computer Research and Development

基  金:国家自然科学基金项目(60435010;90604017;40574001;50674086);国家"九七三"重点基础研究发展规划基金项目(2003CB317004);国家"八六三"高技术研究发展计划基金项目(2006AA01Z128);高等学校博士学科点专项科研基金项目(20060290508);北京市自然科学基金项目(4052025)

摘  要:提出了基于广义信息距离的直接聚类算法.基于信息理论给出了离散量的基本概念,讨论并证明了离散量的一个基本不等式,进而给出了离散增量的概念.在分析距离测度的基础上,提出了广义信息距离(GID)、改进的广义信息距离(IGID),建立了基于GID,IGID的直接聚类算法,并对土地肥力数据资料进行了聚类分析.结果表明,建立的算法与传统的聚类算法相比,算法原理简便、对数据本身的维数与分布要求不高,且具有较好的聚类效果.In this paper a novel direct clustering algorithm based on generalized information distance (GID) is put forward. Firstly, based on information theory, a basic concept of measure of diversity is given and an inequality about measure of diversity is proved. Based on this inequality, a concept of increment of diversity is discussed and a defined. Secondly, by analyzing distance measure, two new concepts of generalized information distance (GID) and improved generalized information distance (IGID) are proposed, and a new direct clustering algorithm based on GID and IGID is designed. Finally this algorithm is applied to soil fertility data processing, and compared with hierarchical clustering algorithm (HCA) . The results of simulation application show that the algorithm presented here is feasible and effective. Because of simplicity of algorithm and robustness. It provides a new research approach for studies of pattern recognition theory.

关 键 词:离散量 离散增量 广义信息距离 直接聚类 

分 类 号:TP391.4[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象