基于谱聚类的多维数据集异常数据检测方法  被引量:2

Detection method of abnormal data in cube based on spectral clustering

在线阅读下载全文

作  者:宋世军[1] 樊敏[2] SONG Shi-jun;FAN Min(School of Transportation and Logistics,Southwest Jiaotong University,Chengdu 610031,China;School of Civil Engineering,Southwest Jiaotong University,Chengdu 610031,China)

机构地区:[1]西南交通大学交通运输与物流学院,成都610031 [2]西南交通大学土木工程学院,成都610031

出  处:《吉林大学学报(工学版)》2023年第10期2917-2922,共6页Journal of Jilin University:Engineering and Technology Edition

基  金:国家重点研发计划项目(2023YFB2304204)。

摘  要:针对多维数据集异常数据检测过程中未对多维数据集进行降维处理,导致多维数据集中异常数据检测精度较低、误检率较高、检测时间较长的问题,提出一种基于谱聚类的多维数据集异常数据检测方法。首先,通过拉普拉斯矩阵对多维数据集中的数据进行聚类,初步分类数据;其次,采用局部线性嵌入(LLE)算法对分类后的数据进行降维处理,用特征向量表达高维数据集,去除多维数据集中的冗余信息;最后,将处理后的多维数据集输入到支持向量机模型中,根据回归估计值的计算,完成异常数据的检测。实验结果表明,本文算法进行多维数据集中异常数据检测的精度更高、误检率更低,检测时间较短。Due to the lack of dimension reduction in the process of cube abnormal data detection,the detection accuracy of abnormal data in the cube is low,the error detection rate is high,and the detection time is long.Therefore,a cube abnormal data detection method based on spectral clustering is proposed.Cluster the data in the multidimensional data set through Laplace matrix,preliminarily classify the data,use LLE algorithm to reduce the dimension of the classified data,express the high-dimensional data set with eigenvectors,remove the redundant information in the multidimensional data set,input the processed multidimensional data set into the support vector machine model,and complete the detection of abnormal data according to the calculation of regression estimates.Experimental results show that the proposed algorithm has higher accuracy,lower false detection rate and shorter detection time.

关 键 词:拉普拉斯矩阵 谱聚类 数据降维 多维数据集 支持向量机算法 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象