基于词共现的大数据研究主题分析  被引量:24

Study on the Theme of Big Data based on Co-word Analysis

在线阅读下载全文

作  者:王一博[1] 郭鑫[2] 王继民[2] 

机构地区:[1]北方工业大学信息工程学院计算机系 [2]北京大学信息管理系

出  处:《图书馆论坛》2014年第8期96-102,共7页Library Tribune

基  金:北京市科技计划项目"科学知识图谱方法在新兴产业发展态势分析中的应用研究"(项目编号:ZI21108002212058)研究成果之一

摘  要:近年大数据已成为产业界、科技界和政府部门共同关注的热点研究领域。文章以中国知网(CNKI)论文的题录信息为数据来源,以共词分析、聚类分析、社会网络分析等为主要研究方法,以计算机程序为解决手段,对大数据领域的关键词进行词频统计,建立高频关键词的共词矩阵,发现共词网络的"核心-边缘"结构,通过层次聚类将大数据领域的研究主题划分为10个类团,并结合战略坐标图对这些类团进行深入分析与探讨,以期为大数据理论与应用研究提供参考。As a hot research, big data has been highly concentrated on by the industrial circles, scientific and technological circles and government sectors in recent years. Taking the research papers from CNKI as data resource, this paper uses co-word analysis, cluster analysis, social network analysis as major research method, and uses computer program to solve conesponding problem. By statistical analysis of key word frequency in big data area, this paper compiles a co-word matrix of high frequency key words, finds core periphery, structure of co-word network, and divides these research topics in big data area into 10 groups with hierarchical clustering. Using strategic diagram, this paper makes an in-depth analysis and exploration of these groups, and attempts to provide some experiences and reference on theory and application of big data.

关 键 词:大数据 共词分析 聚类分析 战略坐标 核心-边缘结构 

分 类 号:G353.1[文化科学—情报学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象