去重

作品数:451被引量:888H指数:13
导出分析报告
相关领域:自动化与计算机技术文化科学更多>>
相关作者:冯丹胡燏翀陈晓峰马建峰张宇成更多>>
相关机构:华中科技大学深圳市腾讯计算机系统有限公司西安电子科技大学华为技术有限公司更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划中央高校基本科研业务费专项资金国家科技支撑计划更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 基金=国家科技支撑计划x
条 记 录,以下是1-6
视图:
排序:
面向虚拟机镜像的改进相似度分组去重优化方法
《广西大学学报(自然科学版)》2017年第6期2154-2162,共9页梁小宇 陈宁江 闫承鑫 刘文斌 
国家自然科学基金资助项目(61363003;61063012);国家科技支撑计划项目课题(2015BAH55F02)
根据实验研究发现,云计算环境中虚拟机镜像备份之间存在大量的冗余数据。尽管传统的去重方法有较高的去重率,但需要花费大量时间,这对有时效性要求的海量镜像备份场景并不适用。考虑虚拟机镜像之间存在大量相同或相似的操作系统和应用...
关键词:虚拟机镜像 重复数据删除 数据备份 相似性 
基于数据路由的分布式备份数据去重系统被引量:2
《计算机工程》2017年第2期85-91,共7页姚敏 尹建伟 唐彦 罗智凌 
国家科技支撑计划项目"现代服务业跨界服务共性技术体系研发与示范应用"(2013AA01A213)
传统数据去重备份系统在大数据应用场景下存在备份存储空间过大和数据吞吐量不足等缺点。为此,基于数据路由设计一种分布式备份数据去重系统。该系统以数据片为去重粒度,具有数据路由和数据预取2个功能。数据路由使用布隆过滤器对需要...
关键词:数据去重 数据路由 数据预取 布隆过滤器 Jaccard距离 
基于特征迭代的短文本去重算法被引量:4
《计算机工程》2015年第12期54-57,63,共5页曹海 孙婧 史喜斌 
国家科技支撑计划基金资助项目(2012BAH13F02);上海市科委基金资助项目(12511502403;12511509602)
由于短文本具有词频单一、结构简单等特点,基于传统特征选取方法的文本去重算法不适合短文本。为此,提出一种适合短文本特点的去重算法,利用SimHash算法产生短文本的指纹,使用共享最近邻算法对指纹进行聚类,根据聚类结果增删初始特征,...
关键词:SimHash算法 共享最近邻 迭代 特征选择 短文本 去重 
金融信息服务系统技术框架研究被引量:3
《计算机系统应用》2014年第7期201-205,共5页俞枫 李洁华 
国家科技支撑计划(2012BAH13F03)
金融资讯数据是投资者进行投资决策、券商投研部门进行研究和撰写研究报告的重要依据.从金融资讯数据的数据整合与存储、信息检索和资讯推荐三个层次出发,提出了一种创新的金融信息服务系统技术框架,并在此基础上描述了国泰君安金融资...
关键词:技术框架 数据整合和存储 信息检索 去重机制 资讯推荐 
微生物天然产物早期鉴别及去重复方法研究进展被引量:1
《湖北农业科学》2013年第22期5409-5414,共6页王开梅 张亚妮 吴兆圆 杨自文 
国家科技支撑计划项目(2011BAE06B004);湖北省农业科技创新中心项目(2007-620-009-001)
微生物天然产物具有独特的结构多样性。随着研究的深入,研究者在进行天然产物筛选时遇到已知化合物的机会加大,有必要在研究的早期对粗提物中的化合物进行早期鉴别及去重复,以减少不必要的人力、物力及财力的浪费。文章对涉及天然产物...
关键词:微生物天然产物 早期鉴别 去重复 薄层层析 液相色谱-光谱联用技术 数据库 
基于Heritrix的网络爬虫研究与应用被引量:4
《软件导刊》2013年第5期123-125,共3页刘高军 夏景隆 
北京市教委科技发展计划项目(KM201310009001);国家科技支撑项目(2012BAH04F03)
主要介绍了主题搜索引擎、网络爬虫的基本概念和Heritrix系统的体系结构,分析了Heritrix的工作流程,在Heritrix框架的基础上进行扩展和优化。通过一个实例,实现了对京东网图书信息的抓取,为建立面向图书信息的垂直搜索引擎提供了网页信...
关键词:网络爬虫 主题搜索引擎 HERITRIX URL地址去重 BKDRHash算法 
检索报告 对象比较 聚类工具 使用帮助 返回顶部