检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:赵芸 唐旭清[1,2] Zhao Yun;Tang Xuqing(School of Science,Jiangnan University,Wuxi,214122,China;Wuxi Engineering Research Center for Biocomputing,Wuxi,214122,China)
机构地区:[1]江南大学理学院,无锡214122 [2]无锡市生物计算工程技术研究中心,无锡214122
出 处:《数据采集与处理》2019年第5期883-892,共10页Journal of Data Acquisition and Processing
基 金:国家自然科学基金(11371174,11271163)资助项目;国际科技合作研究(2011DFR70500)资助项目
摘 要:针对传统多元线性回归分析(Multiple linear regression,MLR)在处理大数据时,特别是具有层次结构的数据,提出了基于层次结构数据的偏回归系数计算模型。该模型通过计算下层中每个部分的偏回归系数及上、下层之间的层次结构矩阵,来计算上层的总体偏回归系数。从理论研究和实际数据试验验证了在计算回归系数时新模型与传统MLR模型具有等效性。同时,新模型能有效解决隐私数据的保护问题,实现计算的并行处理,提高了大数据处理能力。Multiple linear regression(MLR)is widely used in statistical analysis.Based on common tools of the multiple linear regression in big data research,especially in the research of hierarchical structure data,a partial regression coefficient model is proposed here.The total partial regression coefficient is calculated by using each partial regression coefficient at the lower part and the hierarchical matrix between the lower and upper parts.It is validated that the new model is equivalent to the common models of multiple linear regression by the theoretical research and the real data.The new method can effectively solve the problem of privacy data in privacy protection research.Moreover,the new model can realize the parallel computation,which improves the capability of big data processing.
分 类 号:O212[理学—概率论与数理统计]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15