爬虫

作品数:2792被引量:6363H指数:32
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:杨溥郭军赵朋朋徐蔚然崔志明更多>>
相关机构:北京邮电大学电子科技大学华中科技大学哈尔滨工业大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家社会科学基金国家高技术研究发展计划中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于Python的全球7级大震趋势研判系统设计与实现
《地震研究》2025年第3期450-459,共10页马亚伟 孟令媛 臧阳 韩颜颜 姜祥华 王月 解孟雨 杨志高 
中国地震台网中心青年科技基金(QNJJ-202306);中国地震局震情跟踪定向任务(2024010117);中国地震局“震后趋势研判创新团队”.
为提高全球7级以上地震的震后应急效率,设计并实现了一套基于Python的全球7级大震趋势研判系统。针对不同机构对同一地震测定的地震信息存在差异的问题,如震级标度不一致、定位存在差异等,通过统计历史地震提出了利用“时间差小于10 s...
关键词:网络爬虫 7级以上大震 地震应急 震后趋势研判 
Python网络爬虫技术在大数据处理中的应用
《微型计算机》2025年第6期55-57,共3页陈红 
伴随着大数据时代的到来,数据已成为企业决策和科学研究的重要依据。Python网络爬虫技术作为一种高效的数据采集手段,在大数据处理中发挥着越来越重要的作用。本文旨在探讨Python网络爬虫技术的核心组成部分,分析其在大数据处理中的应...
关键词:PYTHON 网络爬虫 大数据处理 数据采集 
基于Python语言的网络舆情大数据传播特征挖掘研究
《陇东学院学报》2025年第2期21-26,共6页胡贵恒 张震 陈翠红 
安徽省教育厅质量工程“鸿蒙应用开发”(2023sdxx174);安徽省职业与成人教育学会重点课题“‘AI大模型+低代码’下高职院校软件开发类课程教学模式的探索与实践”(AZCJ2024024);“华为·安徽”2025产学合作创新课题“‘四维联动,四链融合’的安徽省现代产业院建设模式与路径的分析与研究”(ZCYJ-01)。
为解决网络舆情大数据传播特征挖掘存在读入延迟等问题,提出基于Python语言的网络舆情大数据传播特征挖掘研究。通过Python语言设计基于scrapy开源结构的改进爬虫算法,爬取网络中的舆情大数据;构建舆情大数据文本空间向量模型,提取数据...
关键词:PYTHON语言 网络舆情 大数据 传播特征挖掘 scrapy开源结构 网络爬虫 
恶意网络爬虫行为司法认定的困境及应对
《中共郑州市委党校学报》2025年第2期43-49,共7页张秋芳 
河南省哲学社会科学规划项目“人工智能‘深度伪造’技术滥用的刑法规制问题研究”(2023BFX027);中原工学院基本科研业务费专项资金项目“集成电路布图设计的知识产权保护问题研究”(K2024JJ004);河南省软科学研究计划项目“河南省企业知识产权海外维权援助机制优化研究”(252400411190)。
在大数据时代背景下,网络爬虫技术已成为信息搜索与资源获取的关键手段。然而,恶意网络爬虫行为涉及侵犯知识产权、公民个人信息及计算机信息系统等方面的刑事风险。恶意网络爬虫行为的刑法规制面临“罪与非罪”的界限认定以及司法实践...
关键词:网络爬虫 数据犯罪 刑法规制 司法认定 
基于朴素贝叶斯模型和PageRank算法的电网事故主题爬虫算法
《河南师范大学学报(自然科学版)》2025年第2期124-130,共7页谢树泳 刘之亮 
国家自然科学基金(52377103,52277148);南方电网科技项目(0313002023030103AJ0003,031300KK52222091).
为了减少电网人身安全事故,利用数据挖掘技术构建和分析事故多维数据,建立准确的预警模型十分必要.其中一个极具挑战性的问题是如何在海量网页中自动化采集人身事故样本数据.提出一种朴素贝叶斯模型与PageRank结合的主题爬虫算法.首先...
关键词:电网安全 人身事故 朴素贝叶斯模型 PAGERANK算法 主题爬虫 
基于Python的影评数据收集与可视化分析
《电脑编程技巧与维护》2025年第4期103-105,共3页张眉 
随着互联网的飞速发展,网络影评已经成为人们获取电影信息的重要渠道,电影的评价和反馈在很大程度上影响着人们的选择。豆瓣电影作为一个国内知名的电影评分和评论平台,汇集了大量的用户影评数据。介绍如何利用Python语言的request、Bea...
关键词:PYTHON语言 爬虫 影评数据采集 可视化分析 
基于LDA模型的旅游住宿接待能力评价——以济南市为例
《科技和产业》2025年第6期204-214,共11页张莹莹 陈恒宇 张梦迪 
对济南市旅游住宿设施进行了评价与需求预测研究,利用Python爬虫技术,从携程、去哪儿网和美团等平台抓取数据。应用LDA(latent Dirichlet allocation)主题模型揭示文本数据中的潜在主题结构,从而有效分类住宿地标签。包括XGBoost、CatBo...
关键词:LDA模型 机器学习 层次分析法 熵权法 python爬虫 
基于语义情感分析的网络爬虫舆情分析系统
《信息产业报道》2025年第3期0158-0160,共3页普布卓玛 仁增卓嘎 
网络热点是一种在互联网上短时间内爆发并形成一定程度的公众关注与热议的社会事件,对其进行舆情监测是一种有效的方法。本项目拟以一个热门话题为案例,采用 Scrapy 技术采集今日头条的评论数据,采用中文自动分词软件(jieba),采用TF-IDF...
关键词:网络数据获取 舆情分析 语义情感 网络热点 
广西非遗文化知识图谱构建与数据处理研究
《智能计算机与应用》2025年第3期72-78,共7页张涛 周卫 
非物质文化遗产代表着地区文化历史的沉淀,是中华优秀传统文化的重要组成部分,也是人类文明的宝贵财富,具有无可替代的历史文化价值。对于维护文化多样性来说,保护和传承非物质文化遗产至关重要。然而,在当前网络环境下,广西的非物质文...
关键词:知识图谱 Python爬虫 命名实体识别 关系抽取 Neo4j图数据库 RoBERTa 
论网络爬虫的刑事违法性认定基准
《争议解决》2025年第3期204-211,共8页汪婧怡 陈馨悦 
网络爬虫技术的运用可以促进技术、信息的分享和信息检索的效率,但是爬虫行为的失范导致了恶意爬虫的出现,我国近年来对相关案件的处理也从原来的民事处罚转向了刑事惩处,但是在实践中由于不区分爬虫手段的技术特征和数据的类型导致了...
关键词:网络爬虫 反爬虫措施 开放数据 刑法规制 
检索报告 对象比较 聚类工具 使用帮助 返回顶部