基于CSToT模型的科技文献主题发现与演化研究  被引量:6

Analyzing Scientific Literature with Content Similarity-Topics over Time Model

在线阅读下载全文

作  者:何伟林 奉国和[1] 谢红玲 He Weilin;Feng Guohe;Xie Hongling(School of Economics & Management,South China Normal University,Guangzhou 510006,China)

机构地区:[1]华南师范大学经济与管理学院,广州510006

出  处:《数据分析与知识发现》2018年第11期64-72,共9页Data Analysis and Knowledge Discovery

基  金:国家社会科学基金项目"基于文本挖掘的科技文献知识发现研究"(项目编号:16BTQ071);2016年华南师范大学研究生创新项目"基于深度学习的科技文献挖掘研究"(项目编号:2016wkxm62)的研究成果之一

摘  要:[目的]分析某研究领域科技文献在一段时间内的主题结构并追踪其变化。[方法]基于改进的主题模型CSToT(ContentSimilarity-TopicsoverTime),以国内情报学领域9种期刊作为数据来源,分析国内情报学领域2012年–2016年的研究主题结构以及其演化过程。[结果]CSTo T模型能清晰揭示科技文献主题结构,并获得主题演化关系。对案例数据分析后发现,国内情报学领域研究范围广泛,涉及信息服务、网络舆情、数据挖掘等方面;演化趋势分为上升型、下降型、稳定型和波动型4种;关于信息服务的研究路线演化尤为凸显。[局限]训练数据规模不够大。[结论]CSTo T模型能有效识别科技文献主题结构并获取其演化关系,为相关学科领域的研究与发展提供参考和依据。[Objective] This paper studies the topics of scientific literature and then tracks their changes.[Methods] We used the improved CSToT Model(Content Similarity-Topics over Time), to analyze scholarly papers from 9 information science journals in China published from 2012-2016. [Results] The CSToT model effectively revealed the subject structure of scientific literature and the evolution of topics. We also found that majority of the current information science research covers information services, online public opinion and data mining. Their evolution trends include rising, falling, stable and fluctuating patterns, which are particularly prominent in information services research. [Limitations] The training data set needs to be expanded. [Conclusions] The CSToT model could effectively identify the topics of scientific literature and their evolutionary trends, which provide new directions for future research.

关 键 词:ToT主题模型 主题发现 主题演化 

分 类 号:G202[文化科学—传播学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象