Paperopen中的OA论文垂直蜘蛛设计  

Design of Journal Paper Vertical Spider for Open Access

在线阅读下载全文

作  者:钱建立[1] 吴广茂[1] 张薇[2] 孙滔[2] 

机构地区:[1]西北工业大学机电学院,西安710072 [2]陕西省科技信息研究所,西安710054

出  处:《情报杂志》2008年第6期60-63,共4页Journal of Intelligence

基  金:陕西省科学技术研究发展计划项目“科技论文开放获取搜索引擎研究”(编号:2007K04-11)

摘  要:描述了Paperopen项目中OA期刊论文蜘蛛的总体设计方案、蜘蛛调度机制、论文全文文件命名原则、数据库设计以及页面爬取和蜘蛛调度需要注意的问题,提出通过插件技术可解决一些杂志社网站存在的论文全文链接转向问题。Paperopen采用deep web技术能够获取隐藏在数据库后面的论文数据。采用该方案设计的蜘蛛工作正常,每天可爬取论文1万篇左右,大大提高执行效率。

关 键 词:开放阅读 搜索引擎 垂直蜘蛛 论文仓储 

分 类 号:G350[文化科学—情报学] TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象