网络爬虫技术专利现状  被引量:1

在线阅读下载全文

作  者:唐文俊 曹勇 刘宝俊 

机构地区:[1]国家知识产权局专利局专利审查协作四川中心 [2]重庆金山医疗机器人有限公司 [3]浪潮电子信息产业股份有限公司

出  处:《中国科技信息》2024年第8期17-19,共3页China Science and Technology Information

摘  要:网络爬虫是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本,其又被称为网页蜘蛛。由于万维网的快速发展以及数据的爆炸式增长,对大规模数据的网络进行数据爬取是在2001年进行的,使用了网络爬虫并采用广度优先策略对万维网3.28亿个网页进行研究。而伴随着万维网网络爬虫技术的快速发展,与网络爬虫技术相关的专利申请也与之对应进入了快速的发展阶段。本文的数据是基于网络爬虫相关中英文关键词在智慧芽数据库进行检索后获取到的数据,本文的分析是基于上述获取的数据进行的。

关 键 词:网络爬虫 万维网 大规模数据 数据库 专利申请 广度优先 数据爬取 脚本 

分 类 号:TP393.092[自动化与计算机技术—计算机应用技术] G255.53[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象