爬虫算法

作品数:40被引量:126H指数:6
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:李家京李保国夏火松李星张久岭更多>>
相关机构:清华大学江苏大学兰州交通大学北京电信规划设计院有限公司更多>>
相关期刊:《郑州大学学报(理学版)》《江苏农业科学》《软件导刊》《数字技术与应用》更多>>
相关基金:国家自然科学基金国家社会科学基金国家科技支撑计划国家重点基础研究发展计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于朴素贝叶斯模型和PageRank算法的电网事故主题爬虫算法
《河南师范大学学报(自然科学版)》2025年第2期124-130,共7页谢树泳 刘之亮 
国家自然科学基金(52377103,52277148);南方电网科技项目(0313002023030103AJ0003,031300KK52222091).
为了减少电网人身安全事故,利用数据挖掘技术构建和分析事故多维数据,建立准确的预警模型十分必要.其中一个极具挑战性的问题是如何在海量网页中自动化采集人身事故样本数据.提出一种朴素贝叶斯模型与PageRank结合的主题爬虫算法.首先...
关键词:电网安全 人身事故 朴素贝叶斯模型 PAGERANK算法 主题爬虫 
一种在线训练的自决策主题爬虫算法
《北京航空航天大学学报》2025年第2期602-615,共14页熊观野 杨百龙 
隧道穿越问题是主题爬虫发展过程中无法回避的一个问题,为解决隧道穿越问题,提出一种基于博伊德环的自决策主题爬虫(FCIDOL)算法。该算法以博伊德环为基本框架,按照“观察-评估-决策-行动”形成闭环,根据爬虫已完成的工作——记忆,对观...
关键词:主题爬虫 隧道穿越 自决策 在线学习 冷启动 
基于大数据的深度学习网络爬虫算法在信息搜集与处理中的应用
《科技资讯》2024年第16期55-57,共3页于平 
广东省教育厅2023年度广东省普通高校特色创新类项目“基于深度学习的网络爬虫算法研究与优化”(项目编号:2023KTSCX407)。
旨在利用大数据和深度学习技术优化网络爬虫算法,以更好地满足信息搜集与处理的需求。首先,使用大数据技术进行数据收集;其次,引入词频反转文档频率(Term Frequency-Inverse Document Frequency,TF-IDF)权重作为输入特征的初始权重,并...
关键词:网络爬虫算法 深度学习 信息收集和处理 大数据 
基于机器学习的Web网络爬虫算法优化研究
《软件》2024年第4期4-7,共4页刘俊培 贾继洋 班岚 迟欢 孙沛叶 
北京科技大学天津学院首批骨干人才培养计划“青年骨干教师”项目资助(TYGG2022J05);北京科技大学天津学院第二批校级一流课程建设项目“计算机控制技术”资助(YLKC202107)。
随着互联网的不断发展,网络爬虫在信息获取和数据挖掘等领域中的应用越来越广泛。同时在互联网相关应用中,机器学习技术成为一种非常重要的手段,能够完成更加高效和准确的网络爬取。然而,现有的网络爬虫算法还存在着很多问题,比如效率...
关键词:机器学习 Web网络爬虫算法 算法优化 
基于爬虫算法技术的城市气质研究——以合肥“科里科气”城市气质为例
《现代商贸工业》2024年第1期7-10,共4页韩骞 
国家社会科学基金“供给侧结构性改革背景下中国科技投入与经济发展互动关系测度研究”(17CGL057);合肥市2022年度省市领导圈定课题“合肥‘科里科气’城市气质研究”(SQKT202202)。
城市气质是长久以来城市的遗传基因和资源禀赋结合后的文化沉淀和外在表现,一定程度上指引了城市未来的发展方向。本文基于网络爬虫算法技术进行关键词爬取和词云图分析,从而探讨不同城市由于其主观认识和客观结构的不同而拥有的丰富多...
关键词:城市气质 爬虫算法 词云图 “科里科气” 
特征地图的室内机器人路径规划融合算法被引量:1
《计算机科学与探索》2023年第11期2755-2766,共12页刘朋 任工昌 
国家自然科学基金(61803246);陕西省重点研发计划(2022GY-250)。
为利用特征地图计算效率高的优点,同时解决传统动态窗口法对全局参数敏感的问题,提出一种基于特征地图的路径规划融合算法。通过给出适用于路径规划的特征地图表达方式,改进机器人与障碍物间距离的计算方法,实现了特征地图中障碍物的检...
关键词:路径规划 特征地图 爬虫算法 动态窗口法 融合算法 
面向法律案例的爬虫算法设计与实现
《山西电子技术》2022年第4期72-74,共3页董红松 孔跃辉 葛军 刘继华 
吕梁学院引进博士科研启动经费(2110150604);山西省教育厅教学改革创新项目(J20221132);2020年山西省深度贫困县科技精准扶贫专项项目(2020FP-11)。
随着爬虫技术的蓬勃发展,互联网中诞生出了一系列刑事案件爬虫算法,但是这些算法都有一定的局限性,并且大量爬虫算法的诞生给网站后台服务器带来了极大压力。针对此,设计了一种新的算法,该算法可爬取刑事案情,并能对案情进行简单归类,...
关键词:法律案例 大数据 爬虫算法 刑法案例 
基于机器学习联合网络爬虫算法的果汁鉴伪技术的研究进展被引量:5
《华中农业大学学报》2022年第1期269-276,共8页SUN Yong 王译霄 宣晓婷 张熙悦 邓文艺 靳欢 凌建刚 
宁波市公益类科技计划项目(2019C10104,2019C10033);国家重点研发计划项目(2018YFC1903500)。
果汁鉴伪技术正成为全球食品营养安全领域的研究热点,其发展对果汁质量与安全控制至关重要。结合机器学习联合网络爬虫算法检索文献技术,本文综述了近年来果汁鉴伪技术的研究进展与应用领域,并着重阐述了非靶向/靶向代谢组学鉴伪技术的...
关键词:果汁鉴伪 果汁掺假 网络爬虫 机器学习 非靶向/靶向标记法 代谢组学 
基于爬虫算法提升迁改及时率的研究
《科学与信息化》2021年第6期50-51,共2页姜昊 
随着道路施工愈发普遍,对运营商通信设施稳定运行产生了一定影响。本研究突破线路巡线员按照传统的以天/周/月为周期的巡线模式,通过爬虫技术,为线路代维提供精准的施工段落信息,及时设计迁改,确保网络安全,降低迁改成本。
关键词:爬虫 迁改 网络 
基于anaconda环境下的通用微博评论抓取算法被引量:3
《电子世界》2020年第24期81-83,共3页汪兰兰 
在如今信息科学技术迅速发展的时代背景下,大数据分析在我们的日常生活中发挥着越来越大的作用。而作为信息交互的平台—微博,为我们提供了多层次以及能够随意交流自己言论的功能。如何知道一篇文章下的评论数和评论内容,本论文研究了...
关键词:大数据分析 信息科学技术 信息交互 浏览器 微博评论 网络爬虫算法 抓取算法 评论内容 
检索报告 对象比较 聚类工具 使用帮助 返回顶部