基于引文耦合分析方法的相关词识别  被引量:1

Relevance Terms Recognition Based on Bibliographic Coupling Analysis Method

在线阅读下载全文

作  者:殷希红 乔晓东[1] 张运良[1] 

机构地区:[1]中国科学技术信息研究所

出  处:《情报杂志》2014年第7期161-164,121,共5页Journal of Intelligence

基  金:国家自然科学基金项目"面向特定情报分析应用的知识组织系统快速构建关键问题研究"(编号:71203208);国家"十二五"科技支撑计划课题"面向外文科技文献信息的超级科技词表和本体建设"(编号:2011BAH10B01);中国科学技术信息研究所重点工作项目"汉语科技词系统建设与应用工程"(编号:ZD2012-3-2)的研究成果之一

摘  要:借鉴引文耦合分析方法,将词条定义中的实词比作词条的参考文献,根据词条定义中实词耦合强度实现相关词的识别。首先对词条定义进行分词和词性标注,并进行人工校对,然后抽取出动词和名词词性的实词,以词条定义中实词的耦合强度作为判定标准实现相关词的推荐,并用人工校对的方法,计算相关词识别的准确率、召回率和F值,论证该方法的有效性。该实验将新能源汽车领域汉语科技词系统中随机选择的500条词条及其定义作为测试集,发现该方法可以达到较高的准确率和召回率。Enlightened by citation coupling analysis method, regarding the content words in the definition of term as the term's refer-ences, according to the content words coupling strength of the term's definition, the relevance terms recognition is achieved. First, the Chinese word segmentation, part-of-speech tagging and manual correction of term definition are processed. Then, verbs and nouns con-tent words are extracted and content words coupling strength is regarded as the criterion to achieve the relevance terms recognition. At last, manual correction is used to calculate the precision and recall of relevance terms recognition to demonstrate the effectiveness of this meth-od. This experiment regards the Chinese scientific and technical vocabulary system's 500 randomly selected terms and their definitions as the test set ( in the field of new energy vehicles) and find that the method can achieve a high precision and recall.

关 键 词:词条定义 引文耦合分析 实词耦合 耦合强度 可视化 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象