检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]空军雷达学院,武汉430019
出 处:《电子工程》2011年第1期42-45,共4页
摘 要:设计实现了一个可扩展的相似重复记录检测系统(Extensible Approximately Duplicates Detecting System,EADDS),并描述了该系统的设计思想、整体结构以及系统特点。该系统包括预处理模块、聚类模块、字段匹配模块和记录匹配模块,支持聚类算法和字段匹配算法的定制扩充。并通过实验对比了几种著名的算法,实验结果表明该系统提高了相似重复记录检测的精确度。An Extensible Approximately Duplicates Detecting System(EADDS) is designed and implemented, and the design, the overall structure and characteristics of the system are described. The system includes pre-processing module, clustering module, field and record match module. It supports customization and expansion of clustering and field match algorithms. Through experiments, it compares several well-known algorithms, and experimental results show that this method improves the accuracy of approximately duplicate records detection.
关 键 词:遗传神经网络 相似重复记录检测系统 聚类算法 字段匹配算法
分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28