基于XPath的Web信息抽取的设计与实现  被引量:6

Design and Implementation of XPath-based Web Information Extraction

在线阅读下载全文

作  者:杨文柱[1] 徐林昊[1] 陈少飞[1] 郝亚南[1] 李天柱[1] 

机构地区:[1]河北大学数学与计算机学院,保定071002

出  处:《计算机工程》2003年第16期82-83,113,共3页Computer Engineering

摘  要:提出了一种基于XPath的Web信息抽取方法,鉴于目前还没有免费的商用XPath引擎可用,于是利用DOM定制了一个XPath引擎,实现了Web信息抽取。该文着重介绍了原型系统的工作原理和实现中所采用的具体技术,该方法可用于Web查询和包装器的构造,也可用于格式转换。This paper proposes a prototype system that implements XPath-based Web information extraction. Because there have not any commercial XPath available, it customizes an XPath engine to implement Web information extraction. This paper mainly emphasizes on the principle and technologies of prototype system and the method can be applied to Web query, wrappers implementing and format transformation.

关 键 词:XPATH WEB信息抽取 文档对象模型 

分 类 号:TP392[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象