基于单元间距离估计的不等概率抽样算法及应用  被引量:3

Unequal Sampling Algorithm Based on Kriging with Partial Least Squares Algorithm and Its Application

在线阅读下载全文

作  者:周楷贺 李莉莉[1] ZHOU Kai-he;LI Li-li(College of Economics,Qingdao University,Qingdao 266061,China)

机构地区:[1]青岛大学经济学院,青岛266061

出  处:《青岛大学学报(自然科学版)》2023年第2期5-10,共6页Journal of Qingdao University(Natural Science Edition)

基  金:国家社会科学基金(批准号:2019BTJ028)资助;山东省金融应用重点研究项目(批准号:2020-JRZZ-03)资助。

摘  要:现有大数据的不等概率抽样方法大多基于数据分布,泛化能力较差。为此,利用多层感知机、XGBoost和Kriging模型估计总体单元间的相对距离,提出针对海量数据的不等概率抽样算法。此类算法既不需要考虑总体的分布,又能够保证样本的代表性。实证分析结果表明,基于此算法抽取样本构建的模型与简单随机抽样方法相比,模型参数估计的均方误差更低,效果更稳定。Most of the existing unequal probability sampling methods for big data are based on data distribution and have poor generalization ability.An unequal probability sampling algorithm for massive data was proposed by estimating the relative distances between population elements using a multi-layer perceptron,XGBoost and Kriging models.This kind of algorithm dose not need to consider the distribution of the population,but also can ensure the representative of the sample.The empirical analysis results show that the mean square error of model parameter estimation based on this algorithm is lower than that of simple random sampling method,and its effect is more stable.

关 键 词:不等概率抽样 代理模型 样本代表性 

分 类 号:O212.2[理学—概率论与数理统计]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象