检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:崔馨月
出 处:《长江信息通信》2023年第12期77-79,共3页Changjiang Information & Communications
摘 要:针对日常文本信息、图片信息的爬取调用需求,基于Python Scrapy、Graphite监测组件、Redis数据库等软硬件,建构起分布式自然语言爬取处理的系统架构,设置网络爬虫集群、数据清洗、数据分类、数据存储的功能模块,作出数据清洗过滤、数据字符转码、数据对象添加,使用朴素贝叶斯算法对中文语料库内涉及的文本词汇信息、图像信息,作出高效词图扫描、词频特征提取,使用贝叶斯评估模式完成网络新闻数据评论、舆论导向的输出情绪分析,整合为采集数据分析表格,以便于网络自然语言的自动化识别、过滤、提取与存储。
关 键 词:人工智能 自然语言处理 图文识别与爬取 技术研究
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.147