内码

作品数:284被引量:260H指数:7
导出分析报告
相关领域:自动化与计算机技术电子电信更多>>
相关作者:马会肖杨小玲吴胜远钱培德沈文君更多>>
相关机构:华为技术有限公司苏州大学清华大学山东大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金江苏省高校自然科学研究项目国家火炬计划中国博士后科学基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 基金=国家火炬计划x
条 记 录,以下是1-1
视图:
排序:
基于内码序值聚类的相似重复记录检测方法被引量:8
《计算机应用研究》2010年第3期874-878,共5页鲁均云 李星毅 施化吉 马素琴 
国家火炬计划资助项目(2004EB33006[0]);江苏省高校自然科学指导性计划资助项目(05JKD520050)
检测和消除相似重复记录是数据清理和提高数据质量要解决的关键问题之一,针对相似重复记录问题,提出了基于内码序值聚类的相似重复记录检测方法。该方法先选择关键字段或字段某些位,根据字符的内码序值,利用聚类思想将大数据集聚集成多...
关键词:相似重复记录 内码序值 聚类 等级法 
检索报告 对象比较 聚类工具 使用帮助 返回顶部