检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:褚挺进 华雨臻 丁一鸣[3] 尹建鑫 CHU Ting-jin;HUA Yu-zhen;DING Yi-ming;YIN Jian-xin(School of Mathematics and Statistics,University of Melbourne,Australia Melbourne 3010,Australia;Meituan,Beijing 100102,China;School of Mathematics,Renmin University of China,Beijing 100872,China;Center for Applied Statistics of Renmin University of China,Beijing 100872,China;School of Statistics,Renmin University of China,Beijing 100872,China)
机构地区:[1]墨尔本大学数学与统计学院,澳大利亚墨尔本3010 [2]美团,北京100102 [3]中国人民大学高瓴人工智能学院,北京100872 [4]中国人民大学应用统计科学研究中心,北京100872 [5]中国人民大学统计学院,北京100872
出 处:《数理统计与管理》2024年第3期407-422,共16页Journal of Applied Statistics and Management
基 金:教育部人文社会科学重点研究基地重大项目(22JJD110001)。
摘 要:在有限维参数刻画的误差空间协方差矩阵下,针对带有高维协变量的地理空间线性回归模型的变量选择和参数估计,提出了基于惩罚最小二乘的自适应惩罚最大似然估计算法。给出了维数发散时的两种类型的理论性质刻画——分别是维数发散,但比样本量小时的参数估计的误差收敛速度和稀疏相合性;在维数远远大于样本量时,使用了“主项-对偶项见证”(prime-dual witness)技术得到高维时(p>>n)的非渐近结果的误差收敛速度和模型选择符号相合性。我们发现,在对空间相关矩阵假定某个类(如Matern类)时,若该类待估参数个数有限,则高维协变量的模型选择和参数估计的结果与样本独立时的结果是一致的。通过随机模拟证明了本文使用的坐标下降求解算法的有效性。在一个世界范围内69家实验室的拟南芥的基因型(SNP)与花开时长等表型数据上应用了本文方法进行花开时长表型预测,验证了方法的适用性和优越性。In high dimensional spatial data analysis,we consider the problem of selecting covariates and estimating parameters in spatial linear models with Gaussian process errors.When the problem is of fixed dimension,namely,with fixed number of covariates,considered the penalized maximum likelihood estimation(PMLE)and proposed a one-step sparse estimator,in which consistency and oracle property are obtained.Here we propose a spatial penalized maximum likelihood estimator with high dimensional covariates.The optimization is carried out through a coordinate descent algorithm.The convergence rate for parameters'estimation and sparsistency of model selection are obtained for the diverging dimension case.Furthermore,a primal-dual witness based argument leads to a non-asymptotic result on the estimation and model selection consistency for the p>n high dimensional case.Monte Carlo results show the proposed methods'better performance than other competitors,and a real GWAS for SNP data and many phenotype of spatially distributed cell-line data is analyzed and shown the discovery under geostatistical model.
关 键 词:地理空间统计 高维数据分析 惩罚似然估计 主项-对偶项见证 坐标下降算法
分 类 号:O212[理学—概率论与数理统计]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.143.24.174