检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:徐久成 侯钦臣 瞿康林 孙元豪 孟祥茹 XU Jiucheng;HOU Qinchen;QU Kanglin;SUN Yuanhao;MENG Xiangru(College of Computer and Information Engineering,Henan Normal University,Xinxiang,Henan 453007,China;Engineering Lab of Intelligence Business&Internet of Things,Henan Province,Xinxiang,Henan 453007,China)
机构地区:[1]河南师范大学计算机与信息工程学院,河南新乡453007 [2]智慧商务与物联网技术河南省工程实验室,河南新乡453007
出 处:《计算机工程与应用》2023年第8期73-80,共8页Computer Engineering and Applications
基 金:国家自然科学基金(61976082,62076089,62002103)。
摘 要:针对时间序列模糊C均值聚类算法对噪声数据敏感,及其未能将数据中少量已标记数据所包含的监督信息进行有效利用的问题,提出了一种改进的鲁棒性半监督模糊C均值聚类算法。该算法中先使用马氏距离提出一种样本不确定性分析方法,并加入到半监督模糊C均值聚类建模中,以消除噪声点的影响。并改进半监督模糊C均值聚类的部分监督机制来加大已标记数据的监督能力。采用能够弹性度量时间序列相似性的时间扭曲编辑距离代替欧氏距离进行聚类。通过对7组公开的时间序列数据集进行实验对比,结果表明所提算法具有良好的聚类效果。The fuzzy C-means clustering algorithm is sensitive to noisy data,and it fails to effectively utilize the supervised information contained in the small amount of labeled data in time series data.To address these problems,the paper proposes an improved robust semi-supervised fuzzy C-means clustering algorithm(SRFCM).Firstly,a sample uncertainty analysis method based on Mahalanobis distance is proposed,and add it to the semi-supervised fuzzy C-means clustering(SFCM)modeling to eliminate the influence of noise points.On this basis,by improving the partial supervision mechanism of SFCM,the supervision ability of labeled data is increased.And in the clustering process,the time warped edit distance(TWED),which can elastically measure the similarity of time series,is used instead of the traditional Euclidean distance.Through the experimental comparison of 7 groups of public time series datasets,the results show that the algorithm has excellent clustering effect.
关 键 词:时间序列 半监督聚类 模糊C均值聚类 样本不确定性 时间扭曲编辑距离
分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.222.207.132