主题爬虫

作品数:221被引量:697H指数:12
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:刘柏嵩樊孝忠康丽黄炜汪涛更多>>
相关机构:北京邮电大学北京理工大学武汉大学武汉理工大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家社会科学基金中央高校基本科研业务费专项资金国家科技支撑计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于朴素贝叶斯模型和PageRank算法的电网事故主题爬虫算法
《河南师范大学学报(自然科学版)》2025年第2期124-130,共7页谢树泳 刘之亮 
国家自然科学基金(52377103,52277148);南方电网科技项目(0313002023030103AJ0003,031300KK52222091).
为了减少电网人身安全事故,利用数据挖掘技术构建和分析事故多维数据,建立准确的预警模型十分必要.其中一个极具挑战性的问题是如何在海量网页中自动化采集人身事故样本数据.提出一种朴素贝叶斯模型与PageRank结合的主题爬虫算法.首先...
关键词:电网安全 人身事故 朴素贝叶斯模型 PAGERANK算法 主题爬虫 
一种在线训练的自决策主题爬虫算法
《北京航空航天大学学报》2025年第2期602-615,共14页熊观野 杨百龙 
隧道穿越问题是主题爬虫发展过程中无法回避的一个问题,为解决隧道穿越问题,提出一种基于博伊德环的自决策主题爬虫(FCIDOL)算法。该算法以博伊德环为基本框架,按照“观察-评估-决策-行动”形成闭环,根据爬虫已完成的工作——记忆,对观...
关键词:主题爬虫 隧道穿越 自决策 在线学习 冷启动 
基于大数据背景下的自动化主题爬虫系统设计
《电脑编程技巧与维护》2024年第11期3-5,30,共4页叶芳 方茜 
贵州省教育厅青年科技人才项目(黔教技(2022)258号)《贵州省线上农产品口碑的细粒度意见挖掘研究》;贵州师范学院一般项目(2022YB007)《基于深度学习的评价文本意见挖掘研究》;贵州省中小学地方(校本)课程教材建设研究基地2023年度课程教材研究课题(课题编号:2023GZKCJC0401)《大数据视域下基于混合增强的在线课程资源学习与共享平台研究》。
在大数据时代背景下,用户对数据采集的需求愈发迫切,同时对数据采集自动化处理提出了更高的要求。研究设计并实现了一个自动化的主题爬虫系统,该系统允许用户通过客户端提交的URL和关键词来创建爬虫任务,并自动化地收集与用户指定主题...
关键词:主题爬虫 大数据 Scrapy框架 SpringBoot框架 MYSQL数据库 
基于网络爬虫的网页目标数据精准抓取方法被引量:1
《自动化与仪器仪表》2024年第10期38-42,共5页高祖彦 
恩施职业技术学院自然科学研究项目:“基于Python的网络爬虫技术研究”(EZYQNZK201906);恩施州科技局项目:旅游景区游客导览智能分析系统及景区智慧管控制度与应急指挥平台建设研究(D20220012)。
从海量的网络数据中提取出有价值的信息,为数据分析等应用提供强大的数据支持,网页目标数据的精准抓取的准确性和效率直接影响到后续数据分析和处理的效果,目前方法无法保障爬取数据的数量和质量,导致抓取到的数据不够完善,容易出现重...
关键词:网络爬虫 网页目标数据 精准抓取 主题爬虫 向量空间模型 收获率 
主题爬虫研究综述
《电脑知识与技术》2024年第30期49-51,57,共4页叶芳 方茜 龙思宇 
贵州省教育厅青年科技人才项目(黔教技(2022)258号)《贵州省线上农产品口碑的细粒度意见挖掘研究》;贵州省中小学地方(校本)课程教材建设研究基地2023年度课程教材研究课题(课题编号:2023GZKCJC0401)《大数据视域下基于混合增强的在线课程资源学习与共享平台研究》;贵州师范学院一般项目(2022YB007)《基于深度学习的评价文本意见挖掘研究》。
随着互联网的快速发展,越来越多的信息数据被广泛传播和共享。然而,用户在海量信息中快速准确地找到所需信息成为一个挑战。主题爬虫作为一种专门针对特定领域或主题的网络信息爬取方式,通过对其所需爬取内容的主题分类和关键字提取,极...
关键词:主题爬虫 爬虫技术 网络爬虫 关键字提取 信息检索 
基于VSM与HITS融合的扩展主题型爬虫
《计算机仿真》2024年第10期222-226,共5页陶飞飞 徐佳 徐松阳 唐明伟 
国家自然基金科学基金项目(42001250);国家重点研发计划项目(2018YFC1508100);江苏高校哲学社会科学研究重大项目(2021SJZDA153)。
目前主流开源爬虫框架在分析页面与主题领域关联性上,常采用基于关键词的量化和向量空间模型算法相融合,但融合疏忽了界面语义与特定主题间的关联,导致爬取内容与主题产生偏差。为了给金融等领域的舆情分析提供准确的数据支撑,提出一种...
关键词:扩展主题爬虫 向量空间模型 超链接主题搜索 股票舆情信息 
基于图像内容检索的主题爬虫设计
《电子产品世界》2024年第9期11-13,共3页谭湘菲 孟晴 
为有效提高网络图像信息的检索效率与准确性,首先,介绍了图像内容检索的基本概念与方法;其次,详细分析与探讨了主题爬虫的架构设计,涵盖主要功能模块及主题爬虫工作流程;最后,基于图像内容检索对主题爬虫平台进行设计,包括系统编程与数...
关键词:图像内容检索 主题爬虫 特征提取 
基于主题爬虫的网络舆情系统设计与实现
《无线互联科技》2024年第14期33-35,50,共4页江官星 黄卫 
网络舆情具有快速、广泛传播的特征,发酵扩散时间极短,若未及时发现并妥善处置,可能会引发网络舆情危机,造成严重的危害与影响。为净化网络环境,减少网络舆情爆发所产生的损失,文章以网络爬虫技术为基础,设计了基于主题爬虫的网络舆情...
关键词:主题爬虫 网络舆情 系统设计 功能实现 
融合BTM与TextCNN的文本语义增强主题爬虫研究被引量:1
《软件导刊》2024年第3期21-26,共6页艾芳菊 尹虓寅 
科技大数据湖北省重点实验室开放基金项目(E1KF291005)。
在拥有海量数据的信息时代,如何高效精准地检索到所需信息是一项巨大挑战,主题爬虫是获取某个特定领域信息的有效途径。通用的主题相似度计算通常是基于词粒度的特征表达,而忽略了文本整体的主题特征表达,会影响爬虫系统的查准率和查全...
关键词:主题爬虫 主题相似度 TextCNN BTM Word2vec 
主题网络爬虫研究综述被引量:1
《电脑知识与技术》2024年第8期97-99,共3页刘晓旭 
近年来,随着互联网技术的迅猛发展,互联网数据规模呈现出指数级增长的趋势。这些庞大的互联网数据在给人们生活带来便利的同时,也给信息的查找带来了巨大的挑战。传统的通用网络爬虫在面对越来越大规模的数据抓取工作时,逐渐显得力不从...
关键词:网络爬虫 主题爬虫 搜索策略 链接分析 相关度计算 
检索报告 对象比较 聚类工具 使用帮助 返回顶部