检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国科学技术信息研究所
出 处:《情报杂志》2014年第7期161-164,121,共5页Journal of Intelligence
基 金:国家自然科学基金项目"面向特定情报分析应用的知识组织系统快速构建关键问题研究"(编号:71203208);国家"十二五"科技支撑计划课题"面向外文科技文献信息的超级科技词表和本体建设"(编号:2011BAH10B01);中国科学技术信息研究所重点工作项目"汉语科技词系统建设与应用工程"(编号:ZD2012-3-2)的研究成果之一
摘 要:借鉴引文耦合分析方法,将词条定义中的实词比作词条的参考文献,根据词条定义中实词耦合强度实现相关词的识别。首先对词条定义进行分词和词性标注,并进行人工校对,然后抽取出动词和名词词性的实词,以词条定义中实词的耦合强度作为判定标准实现相关词的推荐,并用人工校对的方法,计算相关词识别的准确率、召回率和F值,论证该方法的有效性。该实验将新能源汽车领域汉语科技词系统中随机选择的500条词条及其定义作为测试集,发现该方法可以达到较高的准确率和召回率。Enlightened by citation coupling analysis method, regarding the content words in the definition of term as the term's refer-ences, according to the content words coupling strength of the term's definition, the relevance terms recognition is achieved. First, the Chinese word segmentation, part-of-speech tagging and manual correction of term definition are processed. Then, verbs and nouns con-tent words are extracted and content words coupling strength is regarded as the criterion to achieve the relevance terms recognition. At last, manual correction is used to calculate the precision and recall of relevance terms recognition to demonstrate the effectiveness of this meth-od. This experiment regards the Chinese scientific and technical vocabulary system's 500 randomly selected terms and their definitions as the test set ( in the field of new energy vehicles) and find that the method can achieve a high precision and recall.
关 键 词:词条定义 引文耦合分析 实词耦合 耦合强度 可视化
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.15.190.49