基于Selenium自动化图像数据的采集  

Based on automated image data acquisition by Selenium

在线阅读下载全文

作  者:冯成 刘昉[1] Feng Cheng;Liu Fang(Guizhou Electronic Information Vocational and Technical College,Kaili 556000,China)

机构地区:[1]贵州电子信息职业技术学院,贵州凯里556000

出  处:《无线互联科技》2023年第9期123-125,141,共4页Wireless Internet Technology

基  金:第二批国家级职业教育教师教学创新团队研究项目,项目名称:大数据技术专业群创新团队建设的组织制度和运行机制,项目编号:ZI2021120101。

摘  要:随着计算机技术的发展,图像数据被广泛地应用在各种领域。因此,图像数据越来越受到人们重视。文章通过分析传统网络爬虫技术采集和数据存储,指出其受到各种因素限制,导致采集图像数据的效率低下,代码设计编写工作复杂,且容易造成存储资源的浪费。为了进一步提高网络爬虫效率,简化图像采集的实现过程以及节约磁盘的存储空间。文章以汽车之家为案例,使用一种基于Selenium+WebDriver方式完成对汽车图像数据自动化采集,并通过OpenCV算法将汽车图像数据进行大比例压缩,较大地节约磁盘的存储空间。With the development of computer technology,image data is widely used in various fields,so image data is getting more and more attention.By analyzing the traditional web crawler technology collection and data storage,this paper points out that it is limited by various factors,leading to the low efficiency of image data collection,complex code design and writing work,and easy to cause the waste of storage resources.In order to further improve the efficiency of the web crawler,simplify the implementation process of image acquisition and save the disk storage space,this paper takes Autohome as an example,using a Selenium + WebDriver method to complete the automatic collection of automobile image data,and compress the car image data in a large proportion through OpenCV algorithm,so as to save the storage space of the disk.

关 键 词:图像数据 自动采集 存储 压缩 

分 类 号:TN919.1[电子电信—通信与信息系统]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象