数据流分类中的概念漂移转移估计方法研究  被引量:6

Transfer Estimation of Concept Drift in Data Stream Classification

在线阅读下载全文

作  者:张杰[1,2] 孙曰瑶[1] 

机构地区:[1]山东大学经济学院,山东济南250100 [2]山东科技大学经济管理学院,山东青岛266510

出  处:《统计与信息论坛》2011年第12期19-25,共7页Journal of Statistics and Information

基  金:山东省自然科学基金项目<面向纵横数据流概念漂移的衍生金融工具风险预警动态建模研究>(ZR2009HQ001);教育部人文社会科学基金项目<基于纵横数据流概念漂移的衍生金融工具风险预警研究>(10YJCZH218)

摘  要:数据流分类中的概念漂移问题是数据挖掘技术领域的前沿和难点,其重点是等级分类可能随着数据序列的转移而产生漂移现象。虽然估计动态漂移及其调整分类的算法已被提出,但现有算法由于目标分布例证的缺失在概念漂移估计方面的表现并不是很好,例证的多少严重影响了估计效果。鉴此,提出了一种新的参数估计方法,称为转移估计法,运用目标分布数据,结合相似分布理论,对现存的算法进行改进,以便实现对数据流分类中的概念漂移现象进行正确检测和估计。通过对虚拟和真实数据集的仿真实验表明,改进算法在数据流分类中的概念漂移估计方面优于现存算法。The concept drift of data stream classification is the forefront and difficult of data mining technology,the focus of its is possible on the drift phenomenon with the hierarchical classification of data transfer sequence.Although the existing dynamic classification algorithms of concept drift have been proposed,they are not very good about the distribution of existing algorithms as examples of the lack of goals in the estimating performance of the concept drift,the number of examples seriously impacts on the estimated parameters.Based on this,a new parameter estimation method,known as the transfer estimation,is presented in this paper,using the target distribution data and similar distribution theory to improve on existing algorithms,the concept drift is correctly detected and estimated in the classification of data streams,The Improved algorithm in the data stream classification is superior to existing algorithms in the estimation of concept drift.

关 键 词:数据流 概念漂移 转移估计 数据挖掘 

分 类 号:TP393.02[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象