国家图书馆WEB数据增量采集设计及其实现被引量：1

Design and Implementation on the Web Data Deduplicated Crawlers of the National Library of China

作　　者：季士妍[1] 赵丹阳 JI ShiYan;ZHAO DanYang(National Library of China,Beijing 100081,China)

出　　处：《数字图书馆论坛》2021年第1期32-37,共6页Digital Library Forum

摘　　要：本文详细介绍网络资源保存技术策略现状,并从国家图书馆网络资源采集的实际业务需求出发,制定并设计符合国家图书馆业务需求的增量采集技术策略,简述国家图书馆基于Heritrix3.4的增量采集实现方法和实验效果,以期为业界提供有益的参考和借鉴。This paper introduces the current situation of web archiving technology strategy in detail,and designs the deduplicated crawlers technology strategy based on the actual practices of web archiving in the National Library of China.It describes the realization method of duplicated crawlers based on heritrix 3.4,so as to provide useful reference for the industry.

关键词：国家图书馆增量采集 HERITRIX

分类号：G255[文化科学—图书馆学]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

国家图书馆WEB数据增量采集设计及其实现被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

国家图书馆WEB数据增量采集设计及其实现 被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

国家图书馆WEB数据增量采集设计及其实现被引量：1