检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]大连理工大学软件学院,辽宁大连116620 [2]内蒙古财经大学职业学院,呼和浩特010010
出 处:《计算机工程与应用》2015年第18期13-17,共5页Computer Engineering and Applications
基 金:国家自然科学基金重点项目(No.U1301253);辽宁省自然科学基金(No.201202032)
摘 要:当前的不完整数据处理算法填充缺失值时,精度低下。针对这个问题,提出一种基于CFS聚类和改进的自动编码模型的不完整数据填充算法。利用CFS聚类算法对不完整数据集进行聚类,对降噪自动编码模型进行改进,根据聚类结果,利用改进的自动编码模型对缺失数据进行填充。为了使得CFS聚类算法能够对不完整数据集进行聚类,提出一种部分距离策略,用于度量不完整数据对象之间的距离。实验结果表明提出的算法能够有效填充缺失数据。Existing algorithms are of low efficiency and effectiveness in imputing missing data. Aiming at this problem,the paper proposes a missing value imputation algorithm based on the CFS clustering and improved auto-encoder model.To cluster the incomplete data set, it improves the CFS clustering algorithm by introducing the partial distance strategy that is used to measure the distance between two objects with missing values. It uses the improved CFS algorithm to cluster the data set. The improved auto-encoder is used to estimate the missing values according to the clustering result. Experiments demonstrate that this proposed algorithm can impute the missing values effectively.
关 键 词:不完整数据 快速密度聚类算法(CFS) 自动编码机 部分距离策略
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.137.210.133