JavaScript引擎在动态网页采集技术中的应用  被引量:37

Extracting Dynamic URLs Using JavaScript Engine

在线阅读下载全文

作  者:王映[1] 于满泉[1] 李盛韬[1] 王斌[1] 余智华[1] 

机构地区:[1]中国科学院计算技术研究所软件研究室

出  处:《计算机应用》2004年第2期33-36,共4页journal of Computer Applications

基  金:国家973规划资助项目(G1998030413);中科院计算所领域前沿青年基金资助项目(20016280-8)

摘  要:怎样提取网页中由JavaScript脚本动态生成的URL,一直是网页采集器设计的一个难题,文中给出了一个基于JavaScript引擎的通用的解决办法和模块实现以及测试结果。How to extract URLs that are dynamically created by JavaScript code in web pages? This paper presents a general solution exploiting a JavaScript engine named SpiderMonkey. This paper also describes its module implementation and gives some experimental results.

关 键 词:网页采集 JavaScfipt引擎 URL提取 SpiderMonkey 

分 类 号:TP393.09[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象