云南高校图书馆联盟文献共享服务平台- 重复网页

公共卫生与预防医学

营养与食品卫生学

人体解剖和组织胚胎学

航空、航天与航海医学

影像医学与核医学

血液循环系统疾病

神经病学与精神病学

皮肤病学与性病学

微生物与生化药学

农业机械化工程

农业电气化与自动化

作物栽培与耕作技术

农业昆虫与害虫防治

木材科学与技术

特种经济动物饲养

材料科学与工程

矿井通风与安全

石油与天然气工程

油气田开发工程

冶金机械及自动化

金属切削加工及机床

机械设计及理论

机械制造及自动化

仪器科学与技术

精密仪器及机械

测试计量技术及仪器

兵器科学与技术

兵器发射理论与技术

武器系统与运用工程

火炮、自动武器与弹药工程

军事化学与烟火技术

动力工程及工程热物理

动力机械及工程

流体机械及工程

核燃料循环与材料

辐射防护及环境保护

电工理论与新技术

电力系统及自动化

高电压与绝缘技术

电力电子与电力传动

微电子学与固体电子学

信息与通信工程

通信与信息系统

信号与信息处理

自动化与计算机技术

控制科学与工程

控制理论与控制工程

检测技术与自动化装置

计算机科学与技术

计算机系统结构

计算机软件与理论

计算机应用技术

合成树脂塑料工业

轻工技术与工程

纺织科学与工程

纺织材料与纺织品设计

纺织化学与染整工程

服装设计与工程

食品科学与工程

粮食、油脂及植物蛋白工程

农产品加工及贮藏工程

水产品加工及贮藏工程

皮革化学与工程

建筑设计及理论

城市规划与设计

供热、供燃气、通风及空调工程

桥梁与隧道工程

水文学及水资源

水力学及河流动力学

道路与铁道工程

交通信息工程及控制

交通运输规划与管理

载运工具运用工程

船舶与海洋工程

船舶及航道工程

港口、海岸及近海工程

航空宇航科学技术

航空宇航推进理论与工程

航空宇航制造工程

人机与环境工程

环境科学与工程

概率论与数理统计

运筹学与控制论

一般力学与力学基础

热学与物质分子运动论

原子与分子物理

粒子物理与原子核物理

测绘科学与技术

大地测量学与测量工程

摄影测量与遥感

地图制图学与地理信息工程

固体地球物理学

大气科学及气象学

大气物理学与大气环境

古生物学与地层学

职业技术教育学

国际共产主义运动

宪法学与行政法学

环境与资源保护法学

马克思主义哲学

发展与教育心理学

考古学及博物馆学

时间限定

时间：

更新时间：

期刊范围

全部期刊核心期刊 EI来源期刊 SCI来源期刊 CAS来源期刊 CSCD来源期刊 CSSCI来源期刊

学科限定全选

重复网页: 作品数：8被引量：26H指数：4; 导出分析报告; 相关领域：自动化与计算机技术更多>>; 相关作者：韦永壮程芃森安俊秀黄宜华袁春风更多>>; 相关机构：南京大学成都信息工程大学北京大学华南师范大学更多>>; 相关期刊：《计算机研究与发展》《计算机应用》《软件导刊》《科技信息》更多>>; 相关基金：教育部科学技术研究重点项目国家自然科学基金浙江省自然科学基金更多>>

在结果中检索

检索结果分析

共条记录，以下是1-8

全选清除导出

参考文献引证文献引用追踪

视图：

排序：

基于SVM的重复网页检测算法: 《软件导刊》2015年第3期57-58,共2页冯金波; 互联网中存在大量重复网页,降低了用户体验并使搜索变得复杂化。为解决这些问题,把相似网页的比较转换成二元分类问题,使用监督学习算法构造判别函数,避免人为设定相似度阈值所带来的误差;通过SVM训练出的判别函数检测网页对,以此检测...; 关键词：SVM 重复网页支持向量机编辑距离最长公共子串

CCDet:一种高效的大规模中文重复网页检测方法被引量：4: 《计算机研究与发展》2013年第S2期140-152,共13页韦永壮袁春风黄宜华; 国家自然科学基金项目(61072152);江苏省工业支撑计划基金项目(BE2011172); 重复文档检测是信息检索领域中一个非常重要的问题.由于网页结构和内容的复杂性,现有方法在网页查重上没有达到很好的准确性,且只有少量工作用于处理包含关系网页检测问题;同时,由于网页数量的巨大,重复网页检测处理时需要考虑大规模数...; 关键词：CCDet算法重复网页检测中文句号特征索引剪切

基于内容特征码的重复网页检测方法探析: 《科技信息》2012年第26期162-163,共2页符于江; 重复网页检测的关键问题是如何有效地提取相似网页内容的特征并对特征进行相似度比较。本文概述了重复网页的定义、检测流程,对重复网页的特征提取方法和比较算法进行了分析,并对目前常用的基于特征的检测算法进行了比较,总结了当前常...; 关键词：重复网页相似网页特征码算法

基于特征词群的新闻类重复网页和近似网页识别算法: 《成都信息工程学院学报》2012年第4期374-379,共6页程芃森安俊秀; 四川省科技厅软科学计划资助项目(2011ZR0058);成都信息工程学院自然科学与技术发展基金项目(CSRF201002)对本文的资助; 新闻类网页是互联网上冗余信息的重灾区。冗余网页不仅会加剧搜索引擎的处理负担,并且会降低用户体验,因此有必要对互联网上的冗余新闻网页实施消重处理。该算法依据新闻报道的自然语法特点将一篇新闻报道分解到词,从7类词性类别中提取...; 关键词：计算机应用网页消重词性分类特征词群

国内网页去重技术研究:现状与总结被引量：9: 《图书情报工作》2011年第7期118-121,93,共5页李志义梁士金; 针对国内2000-2010年之间有关网页去重技术的研究成果进行计量分析,重点从网页结构、网页特征、网页内容、同源网页、元搜索等方面总结和分析去重技术的基本研究现状,并兼论基于布尔逻辑模型与傅立叶系数的网页去重以及网页去重技术在...; 关键词：重复网页同源网页网页去重

基于网页聚类的搜索结果优化算法研究被引量：3: 《计算机应用》2010年第A01期51-53,共3页沈盈洪丰翔龙黄荣游; 浙江省自然科学基金资助项目(X105739); 针对目前搜索引擎搜索结果中普遍存在大量重复网页的现象,提出了一种基于聚类算法DBSCAN的搜索结果优化算法。该算法选取源搜索结果中排名靠前的部分网页,对这部分网页根据网页相似度进行DBSCAN聚类,最大限度剔除冗余网页,实现搜索结果...; 关键词：网页相似度聚类搜索结果 DBSCAN算法重复网页

基于后缀树的中文新闻重复网页识别算法被引量：6: 《现代图书情报技术》2008年第3期55-61,共7页钱爱兵江岚; 针对识别中文新闻重复网页传统方法的不足,提出以后缀树作为基本数据结构,依据新闻网页的标题性和时间性,构建中文新闻重复网页识别算法。该算法以Ukkonen算法和Matching Statistics算法为基础,并对其具体实现进行优化。实验结果表明,...; 关键词：后缀树重复网页 Ukkonen算法匹配统计算法

MD5算法在消除重复网页算法中的应用被引量：5: 《电脑知识与技术》2005年第10期15-16,共2页彭曙蓉章兢杨文忠; 教育部重点项目(教技司2001224); Internet用户通过常用搜索引擎获取Web信息时,往往得到了大量的重复网页信息,从而导致搜索效率不高。本文利用MD5算法成熟及可移植性好的特点,提出了一种基于MD5的消除重复网页的算法,实验证明该算法能有效的去除重复网页,时间和空间的...; 关键词：搜索引擎重复网页 MD5

全选清除导出

共1页<1>

检索报告对象比较聚类工具使用帮助返回顶部

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

重复网页

检索结果分析

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

重复网页

检索结果分析

下载全文

用户登录

高级检索检索式检索