基于主题的Deep Web聚焦爬虫研究与设计  被引量:2

Design and research on Deep Web focused crawler based on the theme

在线阅读下载全文

作  者:姚双良[1] 

机构地区:[1]江苏科技大学教务处,江苏镇江212003

出  处:《西北师范大学学报(自然科学版)》2013年第2期40-43,48,共5页Journal of Northwest Normal University(Natural Science)

基  金:江苏省高校自然科学基金资助项目(10KJB520006)

摘  要:研究如何准确快速获取Deep Web网络资源.提出了一种基于主题的Deep Web聚焦爬虫框架,该框架主要包含了爬行模块、网页分类模块、链接解析模块和查询接口判别模块4大模块.实验结果表明,该爬虫的爬行策略取得了很好的效果,大大提高了效率,可以很好地适应特定主题的结构化Deep Web信息采集.This paper mainly studies how accurate quickly gets Deep Web network resources. A Deep Web focused reptile framework is given. The framework main contains crawling module, page classification module, links resolves module and query interface discriminate module. Through experiments, the reptiles crawling strategy obtained has very good effect, greatly improves the efficiency, can be very good to adapt to the specific subject of structured Deep Web information acquisition.

关 键 词:DEEP WEB 聚焦爬虫 主题 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象