信息抽取研究综述  被引量:178

Research on Information Extraction:A Survey

在线阅读下载全文

作  者:李保利[1] 陈玉忠[1] 俞士汶[1] 

机构地区:[1]北京大学计算机科学与技术系计算语言学研究所,北京100871

出  处:《计算机工程与应用》2003年第10期1-5,66,共6页Computer Engineering and Applications

基  金:国家自然科学基金项目(编号:69973005);国家973重点基础研究发展规划项目(编号:G1998030507-4);北大985项目支持

摘  要:信息抽取研究旨在为人们提供更有力的信息获取工具,以应对信息爆炸带来的严重挑战。与信息检索不同,信息抽取直接从自然语言文本中抽取事实信息。过去十多年来,信息抽取逐步发展成为自然语言处理领域的一个重要分支,其独特的发展轨迹———通过系统化、大规模的定量评测推动研究向前发展,以及某些成功启示,如部分分析技术的有效性、快速NLP系统开发的必要性,都极大地推动了自然语言处理研究的发展,促进了NLP研究与应用的紧密结合。回顾信息抽取研究的历史,总结信息抽取研究的现状,将有助于这方面研究工作向前发展。The research on Information Extraction aims at providing more powerful information access tools to help peo-ple overcome the problem of information overloading.Unlike Information Retrieval,Information Extraction Systems extract factual information directly from natural language texts.In the last decade,Information Extraction has become an impor-tant sub-field of Natural Language Processing.Its unique development track,i.e.accelerating research via systematical and large scale evaluation,and some successful experience,such as the effectiveness of partial-parsing techniques and the importance of fast development cycles,have made it a great and most important impetus to the research of NLP in the last decade.Moreover,Information Extraction has built a more effective connection between NLP researchers and NLP system developers.It will be helpful to review the history and investigate the state of the art of Information Extraction.

关 键 词:自然语言处理 信息抽取 信息检索 命名实体识别 计算机 信息处理 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象