多词共现分析方法的实现及其在研究热点识别中的应用  被引量:25

Implementation of Multiple Words Co-occurrence Analysis and its Application in the Recognition of Research Hotspots

在线阅读下载全文

作  者:高继平[1] 丁堃[2] 潘云涛[1] 袁军鹏[3] 

机构地区:[1]中国科学技术信息研究所 [2]大连理工大学科学学与科技管理研究所 [3]中国科学院技术信息研究所

出  处:《图书情报工作》2014年第24期80-85,98,共7页Library and Information Service

基  金:"863"计划课题"以科技文献服务为主的搜索引擎研制"(项目编号:2011AA01A206);中国科学技术信息研究所所内预研项目"基于论文引用专利的技术对科学的影响分析--以CSTPCD数据库为例"(项目编号:YY-201430)研究成果之一

摘  要:在当前词共现分析多关注两词共现分析的基础上,提出多词共现分析方法,并采用关联规则挖掘中的频繁项集抽取法,实现多词共现的抽取和与分析。以我国国家知识产权局专利数据库(SIPOD)中数字信息的传输领域(H04L)为例,抽取和深入分析该领域中词最多的多词集合和频数最大的多词集合。最后,结合当前文献计量学中研究热点的定义与识别,应用多词共现分析方法发现H04L领域中的6个研究热点,进而对这6个研究热点中的部分代表性专利文献进行介绍。The co-word analysis pays more attention to the two words co-occurrence analysis, the paper proposes multiple words co-occurrence analysis. Based on the frequent item extraction method in the association rule mining, it a- chieves extraction and analysis of the co-occurrence of multiple words. Taking the field of digital information transmission (HO4L) in the State Intellectual Property Office Database (SIPOD) for example ,this paper exacts and deeply analyzes its most frequent words set and the longest words set. At last, based on the analysis and review on the current research hotspots in the bibliometrics, it finds that the six research hotspots in the field of HO4L. The paper introduces part of representative patents on 6 hotspots.

关 键 词:专利计量 多词共现分析 关联规则挖掘 国家知识产权局专利数据库 数字信息的传输 研究热点 

分 类 号:G353.1[文化科学—情报学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象