检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:戴彩艳[1] 陈崚[1,2] 李斌[2] 陈伯伦[1]
机构地区:[1]南京航空航天大学计算机科学与技术学院,江苏南京210000 [2]扬州大学信息工程学院,江苏扬州225009
出 处:《浙江大学学报(工学版)》2017年第3期554-561,共8页Journal of Zhejiang University:Engineering Science
基 金:国家自然科学基金资助项目(61379066)
摘 要:针对传统相似度算法无法预测给定顶点存在的链接问题,以抽样方法为基础,提出一种对复杂网络进行链接预测的方法,找出用户感兴趣节点的相关链接.根据用户感兴趣的节点,使用随机游走的方法,构造一个子图.设定该子图的大小使相似度估计值的误差小于给定的容错阈值.该方法仅在一个小的包含全局信息的子图上进行相似度计算,可以使计算时间大大减少.实验结果表明,算法的时间复杂度与数据集大小呈线性关系,基于局部指标的常见邻居(CN)算法、Jaccard以及PA指标算法的时间复杂度与数据集大小呈平方关系,以全局拓扑路径为基础的Katz算法的时间复杂度与数据集大小呈立方关系.A method of predicting links in complex networks based on sampling method was proposed to find out the link corresponding to the nodes of interest to users,aiming at the problem that the traditional similarity algorithm could not predict the link of a given vertex.Firstly,a corresponding sub-graph of the nodes of interest to users was constructed by method of random walk.By setting an appropriate size of the sub-graph,the similarity error could be restricted to a given fault tolerant threshold range.Since the similarity computation of this method was only operated in a small sub graph which contained the global information,the time cost for computation was greatly reduced.As indicated,the time complexity of this algorithm is linear to the size of the data set;while the other similar algorithms based on local index,such as CN(common neighbor),Jaccard and PA(preferential attachment),are square to the size of the data set;for the global path based approach Katz,the time complexity is cubic to the size of the data set.
关 键 词:链接预测 随机游走 复杂网络 容错阈值 相似度误差 子图
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3