当前知识抽取的主要技术方法解析  被引量:19

Analysis of State-of-the-Art Knowledge Extraction Technologies

在线阅读下载全文

作  者:张智雄[1] 吴振新[1] 刘建华[1,2] 徐健[1,2,3] 洪娜[1,2] 赵琦[1,2] 

机构地区:[1]中国科学院国家科学图书馆,北京100190 [2]中国科学院研究生院,北京100049 [3]中山大学资讯管理系,广州510275

出  处:《现代图书情报技术》2008年第8期2-11,共10页New Technology of Library and Information Service

基  金:国家社会科学基金项目“从数字信息资源中实现知识抽取的理论和方法研究”(项目编号:05BTQ006)的研究成果之一

摘  要:对MnM、KIM、Text2Onto、Amilcare、Melita等具有知识抽取功能的系统所应用的技术方法进行解析。提出在当前知识抽取技术中,机器学习和自然语言分析两大思路各自得到较大发展,并且在相互融合、相互借鉴中受益。在基于机器学习的知识抽取方面,出现以自适应信息抽取(Adaptive IE)、开放信息抽取(Open IE)为代表的新思路,并且有向自动本体学习(Ontology Learning)方向发展的趋势;在基于自然语言分析的知识抽取方面,基于模式标注、语义标注的方法得到广泛关注和进一步完善,并且有向基于Ontology的信息抽取(OBIE)方向发展的趋势。此外,为减少Ontology建设成本,让人们可以利用简单的自然语言构建Ontology,基于受控语言的信息抽取(CLIE)技术也得到一定的关注。Based on the analysis of some state - of- the - art knowledge extraction systems, i. e. , MnM, KIM, Text2Onto, Amilcare and Melita, it brings forward that two kinds of technologies, i. e. , machine learning and natural language analysis, are developed respectively and get benefits from the inter - reference. On machine learning aspect, some new methods, such as Adaptive Information Extraction, Open Information Extraction, are put forward and have a trend toward Ontology Learning. On nature language analysis aspect, the methods of Pattern - Based Annotation and Semantic Annotation get more attention than ever, and have a trend toward Ontology Based Information Extraction. Besides, Controlled Language Information Extraction method is introduced to reduce the cost of Ontology Construction and allow non - specialists to create or edit ontological data using simple nature language.

关 键 词:知识抽取 机器学习 自然语言分析 本体 

分 类 号:G250.7[文化科学—图书馆学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象