基于LDA主题模型的科学文献主题识别:全局和学科两个视角的对比分析  被引量:18

Topic Identification of Scientific Literature Based on LDA Topic Model:Comparative Analysis of Two Views of Global and Discipline

在线阅读下载全文

作  者:王曰芬[1] 傅柱[1] 陈必坤[1] 

机构地区:[1]南京理工大学经济管理学院,江苏南京210094

出  处:《情报理论与实践》2016年第7期121-126,101,共7页Information Studies:Theory & Application

基  金:国家自然科学基金项目"新研究领域科学文献传播网络生长及对传播效果影响研究"(项目编号:71373124);国家社会科学基金项目"学科结构与演化的可视化分析理论框架及应用研究"(项目编号:15CTQ035);江苏省高校哲学社会科学重点研究基地项目"社会计算与舆情分析"(培育点)的研究成果

摘  要:[目的]利用LDA主题模型来探究全局主题和学科主题之间存在的差异。[方法]基于LDA主题模型,以国内知识流研究领域为例,在主题抽取的基础上,比较与分析全局主题和学科主题所存在的差异。[结果]全局主题和学科主题在可描述性、内容相关性、内容质量、学科分布4个方面具有显著的差异。[局限]采用经验判断选取了用于实验分析的全局热点主题和学科热点主题。[Purpose] This paper explores the difference of global-topics and discipline-topics by using LDA( Latent Dirichlet Allocation) topic model.[Method] Based on the LDA topic model,the paper takes the research field of knowledge flow in China as a sample to compare and analyze the difference of global-topics and discipline-topics on the basis of topic extraction.[Result]The experimental result shows the significant differences of global-topics and discipline-topics in 4 areas of descriptive,contextual,content quality,and discipline distribution.[Limitations] Hot topics from global and discipline in experiment are picked out with experience.

关 键 词:LDA模型 科学文献 主题识别 知识流 

分 类 号:G353.1[文化科学—情报学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象