URL过滤

作品数:18被引量:48H指数:4
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:刘燕兵金明珠丁岳伟孙伟王勇更多>>
相关机构:北京邮电大学杭州迪普科技股份有限公司中国科学院武汉大学更多>>
相关期刊:《计算机学报》《计算机技术与发展》《计算机工程与设计》《信息安全与通信保密》更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划中国科学院战略性先导科技专项更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
一种高速URL过滤算法的研究与应用被引量:2
《现代计算机》2016年第2期13-16,共4页黄诚 
当前,传统防火墙的URL过滤方式只是对于规则库中的URL进行过滤,对于新增的涉黄涉暴网站无能为力,或者管理员响应迟钝。针对当前这种现状,提出一种局域网内URL过滤系统,基于网络爬虫和敏感词过滤技术通过爬去网页文本和对于网页文本分析...
关键词:URL过滤 网络爬虫 敏感词过滤 BLOOM Filter HASH表 MD5 
实施URL过滤的最佳十法
《计算机与网络》2014年第23期46-47,共2页孙华天 
URL过滤能够增强网络安全,并强化公司资源的使用策略,对于多数工作场合是一项必需的措施。URL过滤的实施并不难,但如果企业遵循最佳方法就可以使其实施过程更容易和高效。1.作为统一安全方案中的一种特性企业当然可以从专门的厂商购买UR...
关键词:使用策略 URL 网络安全 工作场合 重定向 公司资源 过滤功能 间谍程序 防御系统 邮件服务器 
Web语料抓取中基于相似度的URL过滤规则生成算法
《模式识别与人工智能》2014年第7期631-637,共7页陈荟慧 舒云星 林丽 
教育部哲学社会科学研究重大课题攻关项目(No.12JZD014)资助
Web语料是语料库的重要组成部分,但对冗余URL的访问开支影响大规模语料爬取工作的质量和效率,使用高效的URL过滤规则可提高Web爬取的质量和效率.因网站虚拟目录下的文件分布不均匀,为发现目标文件聚集区域,提出一种生成URL过滤规则的方...
关键词:URL相似度 Web语料爬取 URL过滤 语料分类 
一种面向大规模URL过滤的多模式串匹配算法被引量:14
《计算机学报》2014年第5期1159-1169,共11页刘燕兵 邵妍 王勇 刘庆云 郭莉 
中国科学院战略性先导科技专项课题"媒体内容安全监管技术"(XDA06030602);国家自然科学基金青年基金项目"复杂规则实时检测的模型和算法研究"(61202477)资助~~
对大量有害的URL进行过滤,是目前网络安全应用系统中所亟需的关键技术.使用经典的串匹配算法检测庞大的URL规则集,需要消耗大量的计算资源和存储资源,性能十分低下.该文设计了一种适合于大规模URL过滤的多模式串匹配算法——SOGOPT.该...
关键词:多模式串匹配 URL过滤 最优窗口选择 模式串分组规约 信息安全 网络安全 
基于概率模型的主题爬虫的研究和实现被引量:7
《计算机工程与科学》2013年第1期160-165,共6页白玉昭 梁久祯 
国家自然科学基金资助项目(61170121)
在现有多种主题爬虫的基础上,提出了一种基于概率模型的主题爬虫。它综合抓取过程中获得的多方面的特征信息来进行分析,并运用概率模型计算每个URL的优先值,从而对URL进行过滤和排序。基于概率模型的主题爬虫解决了大多数爬虫抓取策略...
关键词:主题爬虫 概率模型 URL过滤 URL排序 优先值 
基于农业领域的网络爬虫被引量:2
《电脑开发与应用》2012年第8期30-32,共3页吴菊英 贾炅昊 冯秀芳 
山西省科技基础条件平台建设项目(20110910003);太原理工大学大学生创新项目(101011230)
以农业环境为背景,在搜索引擎基础而又非常重要的部分——网络爬虫的基础上,提出了改进的爬虫设计,其中采用了主题相关性判断和网页选择器筛选的方法,并且通过建立对应的农产品词库,结果表明在农业领域的搜索相关性上有大幅度的提高。
关键词:网络爬虫 URL过滤 农业搜索 主题相关性 聚焦模型 
面向移动终端的URL过滤方法被引量:1
《计算机工程与应用》2011年第18期68-72,共5页刘夏 刘萍 刘燕兵 谭建龙 
国家重点基础研究发展规划(973)(No.2007CB311100);国家高技术研究发展计划(863)(No.2009AA01Z436)~~
在移动终端内容安全检测中",黑名单"过滤是一种常用的手段,但有限的存储空间制约了它的应用。根据"黑名单"过滤特点研究了一种多串匹配算法的改进,以Aho-Corasick算法为例,采用两种启发式策略从不等长的URL串中提取具有代表性的、等长...
关键词:移动终端 AHO-CORASICK算法 空间压缩 启发式策略 URL过滤 
基于网络设备的网页过滤的设计被引量:1
《通信技术》2011年第2期78-80,共3页文敬斌 杨忠孝 孙林 
广东省产学研示范基地项目(No.H04010701CXY2009006)
为实现统一高效的网页内容过滤,提出了一种在网络设备上对网页进行过滤的方法。采用URL(Uniform Resource Location)过滤与内容过滤相结合的方式;通过设置黑白名单和老化机制,来改进URL过滤;考虑网页的结构化特性,通过改进特征的权值的...
关键词:黑白名单 URL过滤 内容过滤 K近邻法 
基于统计模型的主题爬虫的研究与实现被引量:3
《计算机工程与设计》2010年第16期3700-3704,共5页金明珠 丁岳伟 
在研究了现存的主题爬虫的基础上,提出了一种基于统计模型的主题爬虫,它对抓取过程中可获得的信息进行分析,并运用统计模型计算的结果过滤URL,有效地解决了偏好特定主题的用户检索和Web信息的索引等相关问题。实验结果表明,与基于链接...
关键词:统计模型 主题爬虫 URL过滤 特征信息 字段 
基于动态主题库的主题爬虫被引量:4
《计算机应用》2009年第B12期44-46,共3页金明珠 丁岳伟 
通过对基于不同策略过滤URL的主题爬虫的研究,提出了一种基于动态主题库的主题爬虫。它能够在运行期间实时地更新主题库,提高了对URL过滤的准确度。实验表明,所提的主题爬虫能够在相对较少的时间中,检索尽量少的网络空间,抓取到较多与...
关键词:主题爬虫 动态主题库 URL过滤 主题相关度 未知字段 
检索报告 对象比较 聚类工具 使用帮助 返回顶部