基于互连网的术语定义获取系统  被引量:13

A Web-Based Term Definition Extracting System

在线阅读下载全文

作  者:许勇[1] 荀恩东[2] 贾爱平[2] 宋柔[2] 

机构地区:[1]北京工业大学计算机学院,北京100022 [2]北京语言大学计算机系,北京100083

出  处:《中文信息学报》2004年第4期37-43,共7页Journal of Chinese Information Processing

基  金:国家自然科学基金资助项目 (6 0 2 72 0 5 5 ) ;国家 86 3计划资助项目 (2 0 0 1AA1 1 4 1 1 1 )

摘  要:文中介绍了一个实验性的基于互联网的术语定义获取系统 ,可以方便、迅速的从互连网上查找术语的定义以及与定义有关的内容 ,给用户迅速获得新生术语以及新技术词汇的定义方面的知识提供方便。系统采用一组术语定义的语言学模式 ,以多线程方式高效下载网页 ,并从中匹配符合术语定义模式的文本段落 ,再经一定后续处理 ,形成返回给用户的结果。系统中使用的语言学模式是在一定量的科技期刊语料库中获取的。试验结果表明系统的运行效率高 。This paper presented an experimental Web Based term definition retrieval system. It can provide the users convenient way to obtain definition related knowledge of newly emerged terms, like Clone, ADSL, etc. The system mainly consists of two modules: web crawling module and term definition matching module. Based on multi thread architecture, the web crawling module downloads web pages efficiently, in which the term definition matching module searches for the term definitions simultaneously with a set of term definition related linguistic patterns. The term definition patterns used in the system are obtained from technology journal corpora. Experiment shows that the system can retrieve term definitions effectively from web and the accuracy of the retrieved result is acceptable.

关 键 词:人工智能 自然语言处理 术语定义 信息抽取 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象