基于异构关系分布的学术网络相似性搜索  

Academic Network Similarity Search Based on Heterogeneous Relation Distribution

在线阅读下载全文

作  者:乔田 张明西[1] 王金华[2] 周飞 刘洲 罗睿 吴玉 QIAO Tian;ZHANG Ming-xi;WANG Jin-hua;ZHOU Fei;LIU Zhou;LUO Rui;WU Yu(School of Communication&Art Design,University of Shanghai for Science and Technology,Shanghai 200093,China;The 32nd Research Institute of China Electronics Technology Corporation,Shanghai 201808,China;Jiangsu Guoxin Jingjiang Power Generation Co.,Ltd,Taizhou 214513,China;Academy of Military Sciences,Beijing 200023,China)

机构地区:[1]上海理工大学出版印刷与艺术设计学院,上海200093 [2]中国电子科技集团公司第三十二研究所,上海201808 [3]江苏国信靖江发电有限公司,江苏泰州214513 [4]中国人民解放军军事科学院,北京200023

出  处:《软件导刊》2023年第4期77-83,共7页Software Guide

基  金:国家自然科学基金项目(62002225);国家重点研发计划项目(2021YFF0900400);上海市自然科学基金项目(21ZR1445400)。

摘  要:随着学术网络的复杂化和大规模化,传统的相似性度量算法大多依赖网络模式,而缺乏普适性,同时在大规模网络上计算效率低。针对上述问题,提出一种基于链接的相似性度量方法。首先,利用全局异构关系分布进行数据统计分析,生成关系特征矩阵以规范化表示不同类型链接关系的重要程度;然后,结合关系特征矩阵扩展TopSim算法,使其适用于大规模学术网络的相似性度量,同时通过阈值过滤加速查询过程;最后,每个查询返回与之最相关的前k个节点。在真实数据集上的实验结果表明,当考虑数据构成及其分布特点时,在保证查询效率的基础上,查询结果的准确率平均提升了7.25%。With the complexity and large scale of academic networks,most traditional similarity metric algorithms rely on network patterns and lack universality,while the computational efficiency is low on large-scale networks.Aiming at the above problems,propose a link-based similarity measure.First,using the global heterogeneous relationship distribution for statistical analysis and generate a relationship feature ma⁃trix to normalize the importance of different types of link relationships.Next,extend the TopSim algorithm with the relational feature matrix adapts the algorithm to the similarity metric of large-scale academic networks,while accelerating query process by threshold filtering.Finally,return top k nodes related most to each query.Results on real datasets indicate that when considering the data composition and its distribution characteristics,query result accuracy is improved by 7.25%on average with guaranteed query efficiency.

关 键 词:学术网络 相似性度量 关系分布 关系特征矩阵 TopSim算法 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象