检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:孔博傲 卢珊 王惠文[3,4] KONG Boao;LU Shan;WANG Huiwen(School of Mathematical Science,Beihang University,Beijing 100191,China;School of Statistics and Mathematics,Central University of Finance and Economics,Beijing 100081,China;School of Economics and Management,Beihang University,Beijing 100191,China;Beijing Key Laboratory of Emergency Support Simulation Technologies for City Operations,Beijing 100191,China)
机构地区:[1]北京航空航天大学数学科学学院,北京100191 [2]中央财经大学统计与数学学院,北京100081 [3]北京航空航天大学经济管理学院,北京100191 [4]城市运行应急保障模拟技术北京市重点实验室,北京100191
出 处:《北京航空航天大学学报》2023年第10期2851-2858,共8页Journal of Beijing University of Aeronautics and Astronautics
基 金:国家自然科学基金(72021001,72001222)。
摘 要:成分数据典型相关分析(CCAI)是一种研究多个成分数据变量之间线性相关关系的方法,在经济、管理、地质、化学等多个领域应用广泛。在海量数据背景下,研究如何针对成分数据流展开典型相关建模分析,具有重要的理论意义和实用价值。为此,提出了成分数据典型相关分析的增量方法,通过对增量成分数据的协方差分解,实现对成分数据流典型相关性的精确计算。同时,给出序贯式和并行式2种分块增量算法,可处理多组成分数据的数据流建模问题,序贯式分块增量算法,按照数据流的先后顺序进行计算,并行式分块增量算法可以达到提高计算效率的目的。通过对不同概率分布和样本规模的成分数据流的仿真研究及微博假新闻的实例分析,验证了所提算法相比于传统的非增量算法,在保证计算准确性的前提下,具有提高运算效率的优势。The approach of connecting linear correlations between several sets of multidimensional compositional variables known as canonical correlation analysis(CCA)for compositional data streams is widely applicable to the study of economics,administration,geology,and chemistry.In the context of massive data,it is of great significance to study how to perform CCA for compositional data streams.Propose an incremental modeling method for the CCA on compositional data streams,which provides accurate results based on the decomposition of the covariance matrix.Furthermore,two incremental modeling methods for compositional data streams are also derived.The first is the sequential block algorithm,which conducts CCA in the order of data stream blocks.The second is the parallel block algorithm,which can improve the calculating efficiency.The proposed methods do indeed outperform non-incremental ones in terms of running time while maintaining the accuracy of canonical correlation computing,according to extensive simulation studies on compositional data with various sample sizes and probability distributions.
关 键 词:成分数据 典型相关分析 数据流 协方差矩阵 特征分解
分 类 号:O212.4[理学—概率论与数理统计]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.198