学术定义抽取系统实现及实验分析  被引量:8

Implementation and Experimental Analysis of the Academic Definition Extraction System

在线阅读下载全文

作  者:刘一宁[1] 郑彦宁[1] 化柏林[1] 

机构地区:[1]中国科学技术信息研究所,北京100038

出  处:《情报理论与实践》2011年第12期15-19,共5页Information Studies:Theory & Application

基  金:国家自然科学基金项目"基于句子匹配分析的知识抽取研究与实现"的研究成果之一;项目编号:70803048

摘  要:设计了一种定义抽取系统,通过混合使用模式规则、语法规则和词频统计以达到定义抽取的目的。详细介绍了系统中的各项关键技术,包括分词技术、抽取规则导入技术、句子抽取技术和加权词处理技术。并选取《情报学报》2007—2008年的235篇论文全文作为实验数据,通过与人工抽取结果进行对比分析,测试了抽取系统的抽全率与抽准率。This paper designs a definition extraction system, which reaches the purpose of definition extraction by the mixed use of pattern rules, grammar rules and word frequency statistics. The paper gives a detailed description of the key technologies of the system, including word segmentation, extraction rules import, sentence extraction and weighted word processing. Taking the 235 articles published in the "Journal of The China Society for Scientific and Technical Information" from 2007 to 2008 as experimental data, the paper tests the recall and precision of the extraction system by comparison with the artificially extracted results.

关 键 词:学术定义 知识抽取 自然语言处理 分析 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象