一种并行Web信息采集系统模型  被引量:1

Parallel system model of Web information retrieval

在线阅读下载全文

作  者:杨天奇[1] 周晔[1] 

机构地区:[1]暨南大学计算机科学系,广东广州510632

出  处:《计算机应用》2007年第1期225-227,共3页journal of Computer Applications

基  金:广东省自然科学基金资助项目(5006102)

摘  要:根据国内外在信息采集领域的发展以及并行采集技术的研究,提出了一个基于多线程并行的W eb信息采集结构模型,该模型以线程并行的方式对W eb页面同时采集,实现了全面、高效并且灵活的信息搜集。Based on the long-time accumulation in the field of Web crawling, and combining the current developing technologies on parallel Web crawling, this article put forward a structure design model of the parallel incremental Web crawler. In order to download Web pages paralleUy, we adopted means of multiple thread that can effectively improve information gathering performance.

关 键 词:并行Web 信息采集 搜索引擎 

分 类 号:N393[自然科学总论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象