基于DOM的规范化WEB信息提取  

在线阅读下载全文

作  者:乔杰华 刘亚卓 王钰博 

机构地区:[1]陆军装甲兵学院信息管理中心,北京100072

出  处:《科学技术创新》2017年第32期94-95,共2页Scientific and Technological Innovation

摘  要:本文以一个新闻列表提取器的实现为目标,针对不同的数据结构和应用需求列举了四种提取模式,并分别为每种模式给出了设计思路和算法逻辑,是基于DOM思想提取HTML信息的典型应用,对于同样有WEB信息聚合与数据采集应用需求的研究实现具有很好的借鉴参考意义。

关 键 词:DOM 提取 选择器 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象