检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国科学技术信息研究所,北京100038 [2]北京市旧机动车交易市场有限公司,北京100070
出 处:《现代图书情报技术》2009年第10期62-66,共5页New Technology of Library and Information Service
基 金:国家自然科学基金青年项目"基于句子匹配分析的知识抽取研究与实现"(项目编号:70803048)的研究成果之一
摘 要:在充分调研高校实验室信息的基础上,针对总结的实验室信息的规律与特征,制定适合信息抽取的实验室信息描述规则,利用规则进行实验室信息的抽取。设计一个针对高校实验室信息的信息抽取系统labIE,并详细论述labIE的体系结构与技术架构,着重论述网页表格判断规则的设计与特征谓词的构造方法。This paper summarizes the laboratory information characters based on analysis of university laboratory Web information, which is used to formulate rules of laboratory Web information. It designs an information extraction system on university laboratory, and presents system architecture and technical architecture of labIE. It also describes the design of rules on table recognition and methodology of constructing characteristic predicate.
关 键 词:实验室Web信息 信息抽取 规则 特征谓词 WEB 页面结构
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.13