相似网页

作品数:11被引量:27H指数:3
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:连浩刘悦许洪波郑鹏丁益斌更多>>
相关机构:华中科技大学中国科学院北京邮电大学北京大学更多>>
相关期刊:《安徽科技学院学报》《电脑编程技巧与维护》《科技信息》《网友世界》更多>>
相关基金:国家重点基础研究发展计划国家高技术研究发展计划西北工业大学研究生创业种子基金教育部人文社会科学研究基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于相似网页文本演化的数据溯源被引量:1
《图书情报工作》2016年第13期134-140,148,共8页倪静 孟宪学 
北京市社会科学基金项目"社交网络中谣言的数据溯源与监控对策"(项目编号:14SHB010);教育部人文社会科学研究规划基金项目"社交网络舆情演化的数据溯源及信任机制研究"(项目编号:15YJAZH052)研究成果之一
[目的 /意义]为解决现有网页文本缺乏起源标注的问题,提出一种借助PROV本体发现相似网页文本起源关系的方法。[方法/过程]通过聚类算法、自动语义标注和关联数据构建等技术的综合应用,结合PROV-POL溯源模型,检测网页文本实体的演变过程...
关键词:PROV模型 内容追溯 关联数据 
基于网页正文结构和特征串的相似网页去重算法被引量:11
《计算机应用》2013年第2期554-557,共4页熊忠阳 牙漫 张玉芳 
为了减少重复网页对用户的干扰,提高去重效率,提出一种新的大规模网页去重算法。首先利用预定义网页标签值建立网页正文结构树,实现了层次计算指纹相似度;其次,提取网页中高频标点字符所在句子中的首尾汉字作为特征码;最后,利用Bloom Fi...
关键词:网页去重 网页标签值 高频标点 特征码 网页指纹相似度 
基于内容特征码的重复网页检测方法探析
《科技信息》2012年第26期162-163,共2页符于江 
重复网页检测的关键问题是如何有效地提取相似网页内容的特征并对特征进行相似度比较。本文概述了重复网页的定义、检测流程,对重复网页的特征提取方法和比较算法进行了分析,并对目前常用的基于特征的检测算法进行了比较,总结了当前常...
关键词:重复网页 相似网页 特征码 算法 
自动提取布局结构相似网页的结构化信息被引量:1
《安徽科技学院学报》2010年第6期37-42,共6页赵靖 王侨文 管马周 单传佳 
安徽科技学院引进人才基金(ZRC2008191);安徽省教育厅自然科学重点项目基金(KJ2008A112);安徽科技学院大学生创新课题基金(10XSZ58)
数据库驱动的Web站点根据查询产生的Web页结构布局都是极其相似的;现有的Web提取方法忽视或者忽略了这种相似性,因而在提取效率性能和通用性上都有较大的限制。本文提出一种基于标签树相似度的模板自动学习方法;进而根据模板来提取这类...
关键词:深层Web 标签树-相似度模型 结构化信息提取 
一种双层网页去重方法研究
《电脑编程技巧与维护》2010年第20期66-67,84,共3页毛晓蛟 
利用Bloom Filter数据结构、shingling算法和MD5编码,构造双层网页去重模型。通过Bloom Filter结构,在网络蜘蛛程序下载网页时,去除重复的网址,并讨论了Bloom Filter出错概率。对已下载的网页用shingling算法去重,阐述了相似网页的判断...
关键词:BLOOM FILTER 错误率 shingling MD5 相似网页 
改进的基于布尔模型的网页查重算法被引量:7
《计算机应用研究》2007年第2期36-39,共4页连浩 刘悦 许洪波 程学旗 
国家"973"计划资助项目(2004CB318109);国家"863"计划资助项目(2005AA142110);计算所知识创新科研课题资助项目(20056570)
提出一种基于布尔模型的网页查重算法,利用布尔模型寻找适当的特征,建立索引以减少网页文档之间的比较次数。实验验证了这种算法的性能,并取得了较好的效果。
关键词:网络 特征 布尔模型 相似网页 
揪出相似网页
《电脑迷》2006年第13期77-77,共1页草无缺 
关键词:网页 标签页面 相似 地址 门户网站 打开 网址 关闭 缩减 弹出菜单 
基于概念的网页相似度处理算法研究被引量:8
《计算机应用》2006年第12期3030-3032,共3页郭晨娟 李战怀 
西北工业大学研究生创业种子基金资助项目(Z200644)
针对海量网页信息,提出适于搜索引擎使用的网页相似度处理算法。算法依据网页抽象形成的概念,在倒排文档基础上建立相似度处理模型。该模型缩小了需要进行相似度计算的网页文档范围,节约大量时间和空间资源,为优化相似度计算奠定了良好...
关键词:相似网页 概念抽取 聚类分析 消重 
快速关闭相似网页
《网友世界》2006年第17期33-33,共1页小黔 
14期《快速揪出相似网页》说了Green Browser浏览器标记相似地址的标签网页,笔者使用的是Maxthon浏览器,虽然在标签栏右击标签网页的菜章并没有相关菜单,但是这并不代表Maxthon不支持此功能。
关键词:相似网页 快速关闭 浏览器 标签 菜单 
快速揪出相似网页
《网友世界》2006年第14期28-28,共1页Jing 
在网上下载文件、浏览新闻和小说,经常要打开多个标签页面。这些页面中有部分来自同一网站。比如在浏览小说时,通过首页的链接打开了多个章节,一个页面看完之后,如果打开的页面很多,寻找下一个章节的页面就变得比较麻烦。借助Green...
关键词:GREENBROWSER 网页 下载文件 页面 小说 浏览 标签 网站 
检索报告 对象比较 聚类工具 使用帮助 返回顶部