HERITRIX

作品数:76被引量:151H指数:6
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:季士妍沈奇威朱敏苏希乐郭小丹更多>>
相关机构:中山大学北京邮电大学成都理工大学国家图书馆更多>>
相关期刊:更多>>
相关基金:国家自然科学基金长江学者和创新团队发展计划国家重点基础研究发展计划教育部科学技术研究重大项目更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
医院网络信息双混沌系统安全加密方法研究
《电子设计工程》2024年第14期105-109,共5页吴洋 
相比其他种类的医疗信息,医院网络信息的安全问题常常被忽视,为了及时发现外部恶意入侵医院的行为,实现对医院网络信息安全加密,设计一种医院网络信息双混沌系统安全加密方法。通过结合多策略非阻塞页面爬取技术与Heritrix框架设计医院...
关键词:医院网络信息 分数阶FOURIER变换 双混沌系统 Heritrix框架 安全加密 
基于遗传算法的APP用户隐私保护文本挖掘系统设计被引量:2
《自动化技术与应用》2024年第3期116-119,共4页童沐雨 刘建平 林熠来 
针对受到句子相似性较高的影响,存在APP用户隐私保护文本挖掘效率低的问题,为此,设计基于遗传算法的APP用户隐私保护文本挖掘系统。使用Heritrix爬虫结构采集文本信息,采用多线程ToePool,管理抓取的线程,借助ARM处理器,预处理文本信息,...
关键词:遗传算法 APP用户 隐私保护 文本挖掘 Heritrix爬虫结构 
Web信息增量采集与保存管理平台的设计与实现
《无线互联科技》2022年第23期68-71,共4页赵丹阳 
随着网络的普及和发展,互联网资源已经成为人类文明记忆的载体,及时并完整的保存网络信息资源变得尤为重要。文章结合国家图书馆网络信息资源采集与保存工作的发展历程、技术发展和互联网信息更新快等特点,提出基于Heritrix开源架构的...
关键词:Web信息抓取 增量采集 增量回显 HERITRIX 平台构建 
杏林搜索:中医药垂直搜索引擎的设计与实现
《电脑编程技巧与维护》2021年第12期21-23,共3页刘伟 杨冯天赐 胡为 杨进傲 吴星瑾 
湖南中医药大学信息科学与工程学院学科开放基金项目——学生创新性实验项目。
随着中医药行业的快速发展,中医药相关数字化资源急剧增加,传统的全文搜索引擎因专业性不够强、内容繁多等问题导致用户无法快速方便地找到所需信息。为此,设计并实现了一款面向中医药领域的垂直搜索引擎具有重要的意义和价值。采用Heri...
关键词:搜索引擎 中医药 Heritrix技术 Lucene技术 中文分词 
国家图书馆网络信息资源采集与保存平台关键技术实现被引量:9
《图书馆》2021年第3期45-50,共6页魏大威 季士妍 
文章介绍了国家图书馆网络信息资源采集与保存发展历程和技术发展,分析了基于开源架构进行定制开发的网络信息资源采集与保存平台的构建架构、功能特点,介绍了网络信息资源增量采集、增量回放显示功能实现的关键技术和方法,并对网络信...
关键词:网络信息采集 HERITRIX 增量采集 增量回放 国家图书馆 
国家图书馆WEB数据增量采集设计及其实现被引量:1
《数字图书馆论坛》2021年第1期32-37,共6页季士妍 赵丹阳 
本文详细介绍网络资源保存技术策略现状,并从国家图书馆网络资源采集的实际业务需求出发,制定并设计符合国家图书馆业务需求的增量采集技术策略,简述国家图书馆基于Heritrix3.4的增量采集实现方法和实验效果,以期为业界提供有益的参考...
关键词:国家图书馆 增量采集 HERITRIX 
一种基于Heritrix 可配置主题的聚焦爬虫方法被引量:1
《楚雄师范学院学报》2020年第6期124-131,共8页王松 刘洪基 叶晓波 
通用搜索引擎存在不能有针对性地满足用户查询需求和搜索关键词难以准确描述的问题。从数据挖掘和机器学习的角度出发,提出一种基于网络爬虫开源框架Heritrix的可配置主题的聚焦爬虫方法,从指定的站源,根据不同的爬取策略,启动多线程爬...
关键词:聚焦爬虫 可配置主题 HERITRIX 
油气行业垂直搜索引擎关键问题解决方案
《计算机系统应用》2018年第12期18-24,共7页王督 蔡永香 李博涵 刘远刚 
地理信息工程国家重点实验室基金项目(SKLGIE2017-M-4-6);国家自然科学基金青年基金项目(41701537);大学生创新项目(201810489071)~~
垂直搜索引擎构建是搜索领域的热点问题之一,应用领域广泛.现有的方法一般都只是对垂直搜索引擎构建中的某一个或几个阶段进行优化,且针对不同网站信息的获取往往需要人工配置操作,较为繁琐.本文在深入研究构建垂直搜索引擎技术的基础上...
关键词:垂直搜索引擎 信息爬取 网页正文抽取 完整词抽取 Heritrix和Solr 
基于Heritrix与Solr的就业主题搜索引擎的研究与优化被引量:3
《齐齐哈尔大学学报(自然科学版)》2018年第4期13-20,共8页郑燕娥 郑志明 
福建省2016年中青年教师教育科研项目(JAT160591)
随着信息化步伐的加快,网络求职越来越普及,通用搜索引擎以及招聘网也成为大学生获取就业信息的主要渠道。针对大多通用搜索引擎搜索的就业信息精准度不高以及招聘网站内容繁杂等问题,研究面向大学生的就业主题搜索引擎系统。借助Herit...
关键词:就业主题 垂直搜索引擎 HERITRIX SOLR IKAnalyzer 
基于互联网垂直搜索的葡萄酒溯源
《中国战略新兴产业》2018年第2X期226-227,共2页许方镪 潘琼 于鑫玉 夏君 
【目的】利用互联网的垂直搜索技术,实现对葡萄酒的产地的溯源。【方法】利用Heritrix爬虫、Lucene全文检索对所给的葡萄酒样品中矿物质含量数据进行搜索,利用数据库保存的数据对输入数据了欧氏距离计算、聚类分析、主成分分析及判别分...
关键词:Heritrix爬虫 Lucene全文检索 产地溯源 垂直搜索 判别分析 
检索报告 对象比较 聚类工具 使用帮助 返回顶部