基于规则的高校实验室Web信息抽取的系统设计与实现  被引量:2

System Design and Implementation of University Laboratory Web Information Extraction Based on Rules

在线阅读下载全文

作  者:化柏林[1] 郭江 

机构地区:[1]中国科学技术信息研究所,北京100038 [2]北京市旧机动车交易市场有限公司,北京100070

出  处:《现代图书情报技术》2009年第10期62-66,共5页New Technology of Library and Information Service

基  金:国家自然科学基金青年项目"基于句子匹配分析的知识抽取研究与实现"(项目编号:70803048)的研究成果之一

摘  要:在充分调研高校实验室信息的基础上,针对总结的实验室信息的规律与特征,制定适合信息抽取的实验室信息描述规则,利用规则进行实验室信息的抽取。设计一个针对高校实验室信息的信息抽取系统labIE,并详细论述labIE的体系结构与技术架构,着重论述网页表格判断规则的设计与特征谓词的构造方法。This paper summarizes the laboratory information characters based on analysis of university laboratory Web information, which is used to formulate rules of laboratory Web information. It designs an information extraction system on university laboratory, and presents system architecture and technical architecture of labIE. It also describes the design of rules on table recognition and methodology of constructing characteristic predicate.

关 键 词:实验室Web信息 信息抽取 规则 特征谓词 WEB 页面结构 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象