当前知识抽取的主要技术方法解析被引量：19

Analysis of State-of-the-Art Knowledge Extraction Technologies

作　　者：张智雄[1] 吴振新[1] 刘建华[1,2] 徐健[1,2,3] 洪娜[1,2] 赵琦[1,2]

机构地区：[1]中国科学院国家科学图书馆,北京100190 [2]中国科学院研究生院,北京100049 [3]中山大学资讯管理系,广州510275

出　　处：《现代图书情报技术》2008年第8期2-11,共10页New Technology of Library and Information Service

基　　金：国家社会科学基金项目“从数字信息资源中实现知识抽取的理论和方法研究”(项目编号:05BTQ006)的研究成果之一

摘　　要：对MnM、KIM、Text2Onto、Amilcare、Melita等具有知识抽取功能的系统所应用的技术方法进行解析。提出在当前知识抽取技术中,机器学习和自然语言分析两大思路各自得到较大发展,并且在相互融合、相互借鉴中受益。在基于机器学习的知识抽取方面,出现以自适应信息抽取(Adaptive IE)、开放信息抽取(Open IE)为代表的新思路,并且有向自动本体学习(Ontology Learning)方向发展的趋势;在基于自然语言分析的知识抽取方面,基于模式标注、语义标注的方法得到广泛关注和进一步完善,并且有向基于Ontology的信息抽取(OBIE)方向发展的趋势。此外,为减少Ontology建设成本,让人们可以利用简单的自然语言构建Ontology,基于受控语言的信息抽取(CLIE)技术也得到一定的关注。Based on the analysis of some state - of- the - art knowledge extraction systems, i. e. , MnM, KIM, Text2Onto, Amilcare and Melita, it brings forward that two kinds of technologies, i. e. , machine learning and natural language analysis, are developed respectively and get benefits from the inter - reference. On machine learning aspect, some new methods, such as Adaptive Information Extraction, Open Information Extraction, are put forward and have a trend toward Ontology Learning. On nature language analysis aspect, the methods of Pattern - Based Annotation and Semantic Annotation get more attention than ever, and have a trend toward Ontology Based Information Extraction. Besides, Controlled Language Information Extraction method is introduced to reduce the cost of Ontology Construction and allow non - specialists to create or edit ontological data using simple nature language.

关键词：知识抽取机器学习自然语言分析本体

分类号：G250.7[文化科学—图书馆学]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

当前知识抽取的主要技术方法解析被引量：19

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

当前知识抽取的主要技术方法解析 被引量：19

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

当前知识抽取的主要技术方法解析被引量：19