AdBagging:自适应抽样参数在线装袋算法  被引量:2

AdBagging:adaptive sampling parameters online bagging algorithm

在线阅读下载全文

作  者:李小斌[1] 李世银[2] 

机构地区:[1]徐州师范大学计算机科学与技术学院,江苏徐州221116 [2]中国矿业大学信息与电气工程学院,江苏徐州221008

出  处:《计算机工程与设计》2011年第12期4095-4099,共5页Computer Engineering and Design

基  金:国家863高技术研究发展计划基金项目(2008AA062200);江苏省产学研联合创新基金项目(BY2009114);徐州师范大学校重点基金项目(10XLA13)

摘  要:通过对数据流分类中的概念漂移问题的研究,提出了一种在线装袋(Online Bagging)算法的改进算法——自适应抽样参数的在线装袋算法AdBagging(adaptive lambda bagging)。利用在分类过程中出现的误分样本数量来调整Online Bagging算法中的泊松(Poisson)分布的抽样参数,从而可以动态调整新样本在学习器中的权重,即对于数据流中的误分类样本给予较高的学习权重因子,而对于正确分类的样本给予较低的学习权重因子,同时结合样本出现的时间顺序调整权重因子,使得集成分类器可以动态调整其多样性(adversity)。该算法具有OnlineBagging算法的高效简洁优点,并能解决数据流中具有概念漂移的问题,人工数据集和实际数据集上的实验结果表明了该算法的有效性。By analyzing the concept drift problem in data stream classification,a new algorithm based on online bagging algorithm named adaptive lambda bagging algorithm(AdBagging) is introduced.The new algorithm dynamically adjusts the sampling parameters of Poisson distribution in online bagging algorithm based on the number of misclassified samples in data stream classification.Through this procedure the new algorithm could give more attention to the misclassified samples and give little attention to the right classified samples.At the same time the learning weight of samples for algorithm can be adjusted according to the temporal order.So the algorithm could solve the concept drift problem in data stream classification.Experiments on synthesize and real data sets prove that the algorithm is effective.

关 键 词:数据流 集成学习 概念漂移 装袋 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象