植物物种多样性语义知识抽取研究  被引量:1

Extracting Semantic Knowledge from Plant Species Diversity Collections

在线阅读下载全文

作  者:刘建华[1,2] 王颖[1] 张智雄[1] 李传席 

机构地区:[1]中国科学院文献情报中心,北京100190 [2]中国科学院大学,北京100049 [3]中国长城资产管理股份有限公司,北京100045

出  处:《数据分析与知识发现》2017年第1期37-46,共10页Data Analysis and Knowledge Discovery

基  金:国家"十二五"科技支撑计划项目"面向外文科技文献信息的知识组织体系建设与应用示范(STKOS)"的子课题"信息资源自动处理;智能检索与STKOS应用服务集成"(项目编号:2011BAH10B05);国家自然科学基金项目"基于语言网络的文本主题中心度计算"(项目编号:61075047)的研究成果之一

摘  要:【目的】拓展以物种为中心的植物物种多样性抽取框架,探索实现语义知识抽取方法。【方法】结合当前生物多样性抽取的主流研究,以物种为中心,设计包含多种实体及实体间关系的知识抽取框架,利用已有的众多专业数据库,设计并实现相应的识别方法。【结果】设计以物种为核心的知识抽取框架,探索实现多种实体及实体间关系的语义知识抽取方法,拓展植物物种多样性领域抽取内容和思路。【局限】实体识别的完整性和准确性受底层知识库影响较大,且实体间关系的类型局限于共现、上下位类、语法关系几类,还需进一步研究。【结论】本研究拓展了植物物种多样性抽取内容和思路,可有效支持语义检索、科学计算。[Objective] This paper aims to extract semantic knowledge from the biodiversity studies. [Methods] We proposed a new knowledge extraction framework focusing on species. It included various entities as well as the relationship among them. The new method was then examined with various specialized databases. [Results] The species-oriented knowledge extraction framework, could successfully retrieve semantic information from the target entities and the relations among them. This method expanded the scope of knowledge extraction practice in the biodiversity field. [Limitations] The recall and precision ratio of the new method was effected by the dictionaries and rules. More studies are needed to examine the semantic relationship among the named entities beyond co-occurrence, hierarchical and simple syntactic relations. [Conclusions] The proposed method expands the contents and methods of knowledge extraction in biodiversity research. It supports the semantic information retrieval and computation.

关 键 词:植物物种多样性 植物物种 知识抽取 关系识别 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象