基于Web语料的概念获取系统的研究与实现被引量：6

Concept Extraction and Verification from Web Corpus

出　　处：《计算机科学》2007年第2期161-165,195,共6页Computer Science

基　　金：自然科学基金(#60273019;60573064;60573063和60496326);国家重点基础研究发展计划(2003CB317008和G1999032701)资助

摘　　要：互联网网页中存在大量的专业知识。如何从这些资源中获取知识已经成为10多年来的一个重要的研究课题。概念和概念间的关系是知识的基本组成部分,因此如何获取并验证概念,成为从文本到知识的过程中的重要步骤。本文提出并实现了一种自动从Web语料中获取概念的方法,该方法利用了规则、统计、上下文信息等多种方法和信息。实验结果表明,该方法达到了较好的效果。There is a large amount of knowledge on the Web pages. How to intelligently acquire knowledge from the massive information on Web pages has become a very important task. Concepts as well as inter-conceptual relations and inter-attribute relations of concepts are the main parts of knowledge. Therefore how toacquire and verify concepts is an important step in the knowledge acquisition. This paper proposes a hybrid approach to automatically extract concepts from large Web corpus. The hybrid approach makes use of rules, statistic, and context information to identify and verify concepts. The experiment shows very good performance of this method for extracting concepts.

关键词：中文信息处理知识获取概念获取概念验证

分类号：TP393[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于Web语料的概念获取系统的研究与实现被引量：6

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于Web语料的概念获取系统的研究与实现 被引量：6

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于Web语料的概念获取系统的研究与实现被引量：6