检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:周楷贺 李莉莉[1] ZHOU Kai-he;LI Li-li(College of Economics,Qingdao University,Qingdao 266061,China)
机构地区:[1]青岛大学经济学院,青岛266061
出 处:《青岛大学学报(自然科学版)》2023年第2期5-10,共6页Journal of Qingdao University(Natural Science Edition)
基 金:国家社会科学基金(批准号:2019BTJ028)资助;山东省金融应用重点研究项目(批准号:2020-JRZZ-03)资助。
摘 要:现有大数据的不等概率抽样方法大多基于数据分布,泛化能力较差。为此,利用多层感知机、XGBoost和Kriging模型估计总体单元间的相对距离,提出针对海量数据的不等概率抽样算法。此类算法既不需要考虑总体的分布,又能够保证样本的代表性。实证分析结果表明,基于此算法抽取样本构建的模型与简单随机抽样方法相比,模型参数估计的均方误差更低,效果更稳定。Most of the existing unequal probability sampling methods for big data are based on data distribution and have poor generalization ability.An unequal probability sampling algorithm for massive data was proposed by estimating the relative distances between population elements using a multi-layer perceptron,XGBoost and Kriging models.This kind of algorithm dose not need to consider the distribution of the population,but also can ensure the representative of the sample.The empirical analysis results show that the mean square error of model parameter estimation based on this algorithm is lower than that of simple random sampling method,and its effect is more stable.
分 类 号:O212.2[理学—概率论与数理统计]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117