基于网络爬虫机制的文献资源可用性监测技术  

Availability Monitoring Technology of Literature Resources Based on Web Crawler

在线阅读下载全文

作  者:闵磊 MIN Lei(School of Education,Jianghan University,Wuhan,Hubei Province,430056 China)

机构地区:[1]江汉大学教育学院,湖北武汉430056

出  处:《科技资讯》2020年第27期5-7,共3页Science & Technology Information

摘  要:在信息化的时代背景下,对电子文献资源库的可用性进行监测,是科研及教学的一项重要保障。该文对基于网络爬虫机制的文献资源监测技术进行了研究,重点探讨了技术选型、HTML文档抓取以及DOM树解析等内容,并对文献资源特征和系统架构展开了分析。该技术以Web服务器访问端口为数据输入源,因而具有较强的平台无关性,能适应网络多样化的特点。In the era of information technology,availability monitoring of electronic literature resources is important for scientific research and teaching.In this paper,we study the monitoring technology based on web crawler mechanism.We focus on technology selection,HTML document capturing,DOM parsing and analyzing the system architecture.This technology takes web services as data source,so it has strong platform independence and is adaptable for complex networks.

关 键 词:网络爬虫 电子资源 可用性监测 HTML解析 

分 类 号:G647[文化科学—高等教育学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象