基于K-means的机构归一化研究  被引量:10

Research on Institutions Normalization Based on K-means

在线阅读下载全文

作  者:孙海霞[1] 李军莲[1] 吴英杰[1] 

机构地区:[1]中国医学科学院医学信息研究所,北京100020

出  处:《医学信息学杂志》2013年第7期41-44,71,共5页Journal of Medical Informatics

基  金:国家"十二五"科技支撑计划项目"科技知识组织体系的协同工作系统和辅助工具开发"(项目编号:2011BAH10B02)

摘  要:分析k-means算法的核心思想和基本步骤,借鉴现有基于频繁词集的文本聚类初始中心确定方法,提出一种面向大规模机构名称归一化处理应用的机构聚类方法,详细阐述机构聚类中心的生成、相似度算法的选择以及迭代次数问题,其实验和应用效果表现良好。The paper analyzes the core idea and basic steps of k - means,learns from the existing methods of determining initial text cluster centers which is based on frequent word sets,proposes a practical institutions cluster method meeting the need of large - scale institutions processing applications.It concretely elaborates the generation of institution clustering center,the selection of similarity algorithm and iterative times,the experimental results and its application perform well.

关 键 词:机构归一 机构聚类 K-MEANS 频繁词集 相似度计算 

分 类 号:G203[文化科学—传播学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象