适用于大规模信息网络的语义社区发现方法  被引量:1

Semantic Community Detection Algorithm for Large Scale Information Network

在线阅读下载全文

作  者:沈桂兰[1,2] 贾彩燕[3] 于剑[3] 杨小平[2] SHEN Guilan;JIA Caiyan;YU Jian;YANG Xiaoping(Business School, Beijing Union University, Beijing 100025, China;School of Information, Remin University, Beijing 100087, China;School of Computer and Information Technology, Beijing Jiaotong University, Beijing 100044, China)

机构地区:[1]北京联合大学商务学院,北京100025 [2]中国人民大学信息学院,北京100087 [3]北京交通大学计算机与信息技术学院,北京100044

出  处:《计算机科学与探索》2017年第4期565-576,共12页Journal of Frontiers of Computer Science and Technology

基  金:国家自然科学基金Nos.71572015;71271209;北京联合大学新起点项目No.Zk10201506~~

摘  要:对节点带有内容的信息网络进行语义社区发现是新的研究方向。融合节点内容增加了算法的复杂度。提出了一种在线性时间内进行语义社区发现的标签传播算法,用LDA(latent Dirichlet allocation)主题模型表示节点内容,以节点内容相似度和传播影响力的乘性模型作为标签传播的策略,在归一化过程中,自然融合节点内容和网络结构信息,标签迭代过程中,采用节点与绝大部分邻居节点内容不相同才进行更新的策略,保证算法的运行效率。通过在不同规模的12个真实数据集上进行实验,以模块度和纯度作为度量标准,验证了算法在语义社区发现上的有效性和可行性。Information network is a kind of complex network with semantic information.The semantic communitydetection of information network is a new research direction.The complexity of community detection algorithm isincreased by considering the node content.Therefore this paper proposes a label propagation algorithm which is suitablefor dealing with large scale information network in linear time.Firstly,the latent Dirichlet allocation topic modelis used to represent the node content.Secondly,the multiplicative model of content similarity and propagation influenceis taken as the label propagation strategy.And the content and the network topology are combined naturally inthe normalization.Thirdly,the algorithm updates the node label while the node and the vast majority of neighborsare not the same.Extensive experiments on12real-world datasets with varying sizes and characteristics validate theproposed method outperforms other baseline algorithms in quality.

关 键 词:语义社区发现 LDA主题模型 内容相似度 标签传播策略 传播影响力 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程] TP391.1[自动化与计算机技术—控制科学与工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象