面向不平衡数据的逻辑回归偏标记学习算法  被引量:5

Partial label learning algorithm for imbalanced data based on logistic regression

在线阅读下载全文

作  者:周瑜[1] 顾宏[1] 

机构地区:[1]大连理工大学电子信息与电气工程学部,辽宁大连116024

出  处:《大连理工大学学报》2017年第2期184-188,共5页Journal of Dalian University of Technology

基  金:国家自然科学基金资助项目(61502074;U1560102)

摘  要:偏标记学习是近几年提出的新机器学习框架,已有的逻辑回归偏标记算法尚不能解决数据不平衡问题.建立了一种可以解决数据不平衡的逻辑回归模型偏标记学习算法.基本思想是在多元逻辑回归模型中定义新的似然函数以达到处理不平衡数据的目的.算法先根据训练集中各个类别样本所占比例定义了一个新的似然函数,之后通过逼近和求导等数学手段推导得到了能够求解的光滑的逻辑回归偏标记学习模型.在UCI数据集和真实数据集上的仿真实验表明,所提算法在数据存在不平衡问题时提高了样本的平均分类精度.Partial label learning is a new machine learning framework proposed in rexisting partial label learning algorithms based on logistic regression have not solved tdata imbalance. A partial label learning algorithm for data imbalance is presented based on logistic regression model. The basic idea is to define a new likelihood function in the multiple logistic regression models to deal with imbalanced data. Firstly,a new likelihood function is defined according to the proportion of each class sample in the training set; then, the smooth and logistic regression- based partial label learning model is derived through derivation and approximation method. Simulation experiments on UCI data sets and real world data sets show that the proposed algorithm improves theaverage classification accuracy of sample for data imbalance problem.

关 键 词:偏标记学习 数据不平衡 逻辑回归 阻尼牛顿法 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象