一种基于跨领域典型相关性分析的迁移学习方法  被引量:30

A Transfer Learning Based on Canonical Correlation Analysis Across Different Domains

在线阅读下载全文

作  者:张博[1,2,3] 史忠植[1] 赵晓非[1] 张建华[1,3] 

机构地区:[1]中国科学院计算技术研究所智能信息处理重点实验室,北京100190 [2]中国矿业大学计算机科学与技术学院,江苏徐州221116 [3]中国科学院大学,北京100049

出  处:《计算机学报》2015年第7期1326-1336,共11页Chinese Journal of Computers

基  金:国家"九七三"重点基础研究发展规划项目基金(2013CB329502);国家自然科学基金(61035003;61202212;61072085;60933004;61379101);国家"八六三"高技术研究发展计划项目基金(2012AA011003);国家科技支撑计划课题(2012BA107B02);中国信息安全测评中心(CNITSEC-KY-2012-006/1)资助~~

摘  要:作为迁移学习的一个重要研究方向,基于特征映射的方法学习各领域特有特征与领域共享特征之间的相关性,通过一些相关特征减少领域之间的差异,已经获得了广泛的关注和研究.典型相关性分析是一种用来分析两组随机变量之间相关性的统计分析工具.将典型相关性分析引入迁移学习,结合基于特征映射迁移学习的思路,提出了一种跨领域典型相关性分析算法.该算法在保持各领域特有特征与领域共享特征相关性的基础上,通过选择合适的基向量组合训练分类器,使降维后的相关特征在领域间具有相似的判别性.在20Newsgroups上864个分类问题以及多领域情感分析数据集上12个分类问题的实验结果表明,跨领域典型相关性分析算法可以有效地提高跨领域迁移分类准确率.As one of the most important research directions of transfer learning,featurerepresentation-transfer approaches focus on the correlation between bridge features and all the other specific features from different domains and reduce the difference between the domains by learning some relevant features,have attracted wide attention and study.Canonical correlation analysis(CCA)is a statistical analysis tool,used to analyze the correlation between the two sets of random variables.By introducing CCA to transfer learning,this paper developed a canonical correlation analysis across different domains called CCADD(Canonical Correlation Analysis across Different Domains),followed by the idea of feature-representation-transfer approaches.Under the premise of maintaining the correlation between bridge features across all domains and specific features from different domains respectively,this algorithm selects an appropriate combination of basis vectors to train the classifier,in which the projected relevant features have similar discrimination.Experimental results on the 864 classification problems in 20 Newsgroups,as well as12 classification problems in multi-domain sentiment analysis datasets,show that CCADD can significantly improve the cross domain prediction accuracy of a baseline non-transfer method.

关 键 词:迁移学习 典型相关性分析 跨领域分类学习 领域自适应 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象