数据表示的相关性度量方法  

On the Correlation Measurement of Data Representations

在线阅读下载全文

作  者:刘吉元 刘新旺[2] 蔡志平[2] 祝恩[2] 鞠儒生[1] LIU Ji-Yuan;LiU Xin-Wang;CAI Zhi-Ping;ZHU En;JU Ru-Sheng(College of Systems Engineering,National University of De fense Technology,Changsha 410072;College of Computer,National University of Defense Technology,Changsha 410072)

机构地区:[1]国防科技大学系统工程学院,长沙410072 [2]国防科技大学计算机学院,长沙410072

出  处:《计算机学报》2024年第7期1568-1581,共14页Chinese Journal of Computers

基  金:国家自然科学基金青年科学基金项目(No.62306324);国家自然科学基金面上项目(No.62376279,No.62276271);国家自然科学基金国家杰出青年科学基金项目(No.62325604)资助.

摘  要:数据表示之间的相关性度量是机器学习和人工智能技术的基石.然而现有的度量方法要么数据表示的全局信息考虑不足,要么复杂度较高,限制了相关技术的进一步发展.为解决上述问题,本文提出一种数据表示的对齐度量方法,称为表示对齐(Representation Alignment,RA).此度量方法能够全局性地衡量任意两个数据表示之间的相关性,且其在样本数量和特征维度上的计算复杂度均为线性.在此基础上,我们将RA扩展到了对比学习领域,进一步提出了基于对比的表示对齐(Contrastive Representation Alignment,CRA)度量方法.上述两个度量方法可自然地用于多视图学习场景,即可通过最大化不同视图数据之间的RA和CRA来融合各个视图之间的信息.为验证这一点,我们还提出了两个新颖多视图聚类算法,并在七个基准数据集上取得了领先的聚类性能.The correlation measurement between data representations is the basis of machine learning and artificial intelligence techniques.However,existing methods either overlook the global information on the involved representations partially or scale poorly.To address the issue,this paper proposes the Representation Alignment(RA)to globally measure the correlation between two arbitrary data representations in linear time to the dimension and the number of samples.We further extend the representation alignment to the Contrastive Representation Alignment(CRA),where the concerned representations are two augmentations(in the scope of contrastive learning)of data samples.In addition,the two alignments can be naturally applied in multi-view learning systems by maximizing them on the latent representations of different data views so as to integrate their complementary information.To validate this,we develop two novel multi-view clustering algorithms and achieve state-of-the-art performance on seven benchmark datasets.

关 键 词:表示对齐 对比学习 多视图聚类 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象