基于作者引用文献关系的潜在研究兴趣主题发现  被引量:5

Detecting potential research interest topics using relationship between authors and cited papers

在线阅读下载全文

作  者:冯小东[1] 武森[1] 王佳晔 

机构地区:[1]北京科技大学东凌经济管理学院,北京100083

出  处:《中国科技论文》2014年第1期65-70,共6页China Sciencepaper

基  金:高等学校博士学科点专项科研基金资助项目(20120006110037);国家自然科学基金资助项目(71271027);中央高校基本科研业务费专项资金资助项目(FRF-TP-10-006B)

摘  要:扩展LDA(latent dirichlet allocation)模型,提出基于作者引用文献关系的作者-兴趣主题-文献模型。每个作者被分配一个在所有主题上的多项概率分布,每个主题被分配一个在所有文献上的多项概率分布。在DBLP(digital bibliography&library project)文献引用关系数据集上的实验表明,所提模型能有效地提取一个研究领域的主要潜在研究兴趣主题及其所包含的代表性文献,并能挖掘每个作者属于每个研究兴趣主题的分布。Literatures cited in academic papers can reflect the authors’research interests to some extent.Thus,the citations,not papers themelves,can be used to discover authors’potential research interest topics.The extending LDA (latent dirichlet alloca-tion)model,an author-interest topic-literature model focusing on citation relationship is proposed in this paper.In this model, each author is associated with multinomial distribution over all the topics,while each topic is associated with multinomial distribu-tion over all the cited literatures.Experiment on citation relationships from DBLP dataset shows that it can detect potential inter-est topics and representative cited literatures effectively,and each author’s interest distribution on different topics can also be de-scribed.

关 键 词:数据挖掘 主题发现 LATENT DIRICHLET ALLOCATION 作者-兴趣主题-文献模型 

分 类 号:O157.5[理学—数学] TP391.1[理学—基础数学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象