半监督学习在链接预测问题中的应用  被引量:6

Link prediction using semi-supervised learning

在线阅读下载全文

作  者:陈可佳[1,2] 韩京宇[1,2] 郑正中[1] 

机构地区:[1]南京邮电大学计算机学院,南京210046 [2]南京邮电大学计算机技术研究所,南京210003

出  处:《计算机工程与应用》2012年第33期136-141,221,共7页Computer Engineering and Applications

基  金:国家自然科学基金青年基金(No.61100135;No.61003040);教育部归国留学人员启动基金(No.BJ210022);南京邮电大学人才引进启动基金(No.NY209013)

摘  要:链接预测是社会网络分析领域的关键问题,研究如何从已知网络中预测可能存在的新链接。现实网络中存在了大量未连接的节点对,从中挖掘潜在信息可以帮助实现链接预测任务。将链接预测视为二类分类问题,使用半监督学习技术,利用网络中的未标记数据帮助学习。使用了两种半监督范式:自我训练和协同训练。在现实数据集Enron和DBLP中的实验结果表明,链接预测任务中采用未标记数据能够有效提高预测的准确率。Link prediction is the key issue in social network analysis,which aims to predict new links from the known networks.In real networks,there exist a large number of unlinked node pairs,whose intrinsic information can be helpful to the link prediction task.In this paper,link prediction is looked as a binary classification problem,where the semi-supervised learning techniques are used to take advantage of unlabeled data in learning process.Two semi-supervised paradigms are used:self-training and co-training.The experimental results in real datasets Enron and DBLP show that,exploiting unlabeled data can effectively improve the accuracy of the link prediction.

关 键 词:链接预测 半监督学习 自我训练 协同训练 社会网络分析 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象