非结构化文本中内容对象抽取的技术方法综述  被引量:1

Review of the Technologies and Methods for Extracting Content Objects from Unstructured Text

在线阅读下载全文

作  者:张智雄[1] 吴振新[1] 赵琦[1,2] 洪娜[1,2] 徐健[1,2,3] 刘建华[1,2] 

机构地区:[1]中国科学院国家科学图书馆,北京100190 [2]中国科学院研究生院,北京100080 [3]中山大学资讯管理系,广州510275

出  处:《数字图书馆论坛》2008年第9期1-12,36,共13页Digital Library Forum

基  金:本文受国家社会科学基金项目'从数字信息资源中实现知识抽取的理论和方法研究'(05BTQ006)和国家'十一五'科技支撑计划课题'网络科技信息监测与评价'(2006BAH03B05)的资金资助

摘  要:近年来,知识抽取技术在非结构化文本的处理中起到很重要的作用.文章在对当前知识抽取的相关文献、系统和项目分析研究的基础之上,提出了当前知识抽取研究中的主要抽取内容对象的分类,并对这些主要内容对象抽取的相关技术方法进行综述.主要总结了Web对象识别和集成、术语识别和抽取、主题发现和识别、概念层次关系的抽取、非概念层次关系的抽取、事实抽取、观点抽取和倾向识别等7种内容对象抽取的技术方法.并在此基础之上,对未来知识抽取的发展趋势进行了分析.该文为2008年第9期本期话题'知识抽取'的文章之一.

关 键 词:知识抽取 对象识别 术语抽取 主题发现 关系抽取 事实抽取 观点抽取 数字图书馆 

分 类 号:G2[文化科学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象