基于网络关系的分类变量预测研究  

Research on Predicting Discrete Variables Based on Network Relationship

在线阅读下载全文

作  者:丁月 方匡南[3] 兰伟[4] 徐顺 Ding Yue;Fang Kuangnan;Lan Wei;Xu Shun

机构地区:[1]西南交通大学经济管理学院 [2]西南交通大学服务科学与创新四川省重点实验室 [3]厦门大学经济学院 [4]西南财经大学统计学院和统计研究中心 [5]四川新网银行

出  处:《统计研究》2024年第1期148-156,共9页Statistical Research

基  金:国家重点研发计划“分布式统计学习理论与方法”(2022YFA1003702);国家自然科学基金面上项目“基于多源信息融合的高维分类方法及其在信用评分中的应用”(72071169);国家自然科学基金面上项目“数据驱动的跨项目知识转移方法研究:知识图谱与迁移学习视角”(72171197)。

摘  要:传统的预测方法通常基于个体的协变量信息进行建模和预测,少有考虑个体间的网络结构信息。事实上,网络节点间的关联信息能够为节点的响应变量预测提供信息,为此本文提出网络标签传播算法。基于半监督学习框架,以邻接矩阵为节点相似性推断依据,通过节点间的连接信息和已知节点的响应变量信息,来推断未知节点的响应变量信息。该算法适用于响应变量为分类变量的不完整网络数据。在网络服从随机分块模型的设定下,本文证明了该算法能够一致地预测未知节点的响应变量。数值模拟和实证数据分析结果显示,该算法预测效果较好。Traditional prediction methods usually model and predict the responses based on the covariate information,but seldom consider the network connection of individuals.However,the relationship of network nodes can provide information for the prediction of nodal responses.Based on this finding,this study proposes a network label propagation algorithm.Based on the framework of semi-supervised learning,this study takes the adjacency matrix as the basis of nodal similarity inference,then infers the response of unknown nodes through the connection information between nodes and the response of known nodes.The algorithm is suitable for incomplete data responses whose response variables are discrete.Under the assumption that the network follows the stochastic block model,this study proves that the response of unknown nodes can be predicted consistently by the algorithm.Numerical simulation and empirical research show that this algorithm performs well in prediction.

关 键 词:不完整网络 网络插补 网络标签传播 分类变量 信用风险评估 

分 类 号:O212[理学—概率论与数理统计] F832.4[理学—数学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象