数据缺失情况下函数型数据聚类方法及应用  被引量:3

Application of Functional Data Clustering Methods on Missing Data

在线阅读下载全文

作  者:高明慧 易丹辉[1,2] 彭锦[3] 胡镜清[4] 杨燕[5] 

机构地区:[1]中国人民大学应用统计科学研究中心,北京100872 [2]中国人民大学统计学院,北京100872 [3]中国中医科学院中医临床基础医学研究所,北京100700 [4]中国中医科学院中医基础理论研究所,北京100700 [5]湖北中医药大学,湖北430065

出  处:《世界科学技术-中医药现代化》2017年第12期1966-1975,共10页Modernization of Traditional Chinese Medicine and Materia Medica-World Science and Technology

基  金:国家科学技术部"十二五"科技支撑计划项目:中医诊疗与康复设备示范研究(2012BAI25B00);负责人:胡镜清;中医健康状态辨识干预评价技术研究与应用(2012BAI25B02);负责人:胡镜清;中国人民大学2017年度‘中央高校建设世界一流大学(学科)和特色发展引导专项资金’;教育部人文社会科学重点研究基地重大项目:基于大数据的精准医学生物统计分析方法及其应用研究(16JJD910002);负责人:易丹辉

摘  要:本文主要讨论了函数型数据的聚类方法,将其应用于中医宗气数据进行实证分析。函数型数据假定认为离散的时间观测由真实存在的连续时间函数决定,这一连续时间函数可以通过无穷多个基函数及其系数表示。函数型聚类的方法有原始数据聚类法、筛选方法和自适应方法。当某些时间点上的样本观测存在缺失时,原始数据聚类法无法计算样本所属类别。筛选方法用于完整时间观测数据的函数型聚类问题,在数据存在缺失时,虽然可以进行函数曲线的拟合,但是效果并不理想,因此聚类效果也不好。自适应方法不仅适用于完整观测而且可以解决存在缺失的函数型数据的聚类。本文将自适应方法应用于存在缺失的中医宗气时间观测,将老年人按照宗气水平分成宗气充足、宗气水平一般、宗气不足三类人群。函数型聚类的自适应方法划分人群特征的效果比较好。This article mainly introduces the functional clustering methods and demonstrates its performance by the real analysis of Chinese medical Zong Qi data. The functional clustering analysis hypothesizes that the discrete time series observations are dominated by a continuous function of time, which can be expressed by infinite basis functions.Functional clustering methods include raw data method, filtering method and adaptive method. When dealing with the sparse data clustering analysis, raw data method encounters the difficulty of matrix calculation due to the lack of data on some time grids. Filtering method suits for full time data, while when facing missing data, the fitting curve is inaccurate so that the clustering outcome cannot be explainable. Adaptive method can be applied flexibly to both full time and sparsely sampled data. In the real analysis section, the adaptive method is used to cluster the sparsely sampled Chinese medical Zong Qi time series data, where the elderly individuals are divided into three clusters, the ones with high level of Zong Qi, the ones with moderate level and those with low level. The adaptive method performs well on clustering individuals.

关 键 词:函数型 聚类 缺失数据 自适应方法 

分 类 号:R-3[医药卫生]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象