基于遗传神经网络的相似重复记录检测方法研究  被引量:1

Study on Approximately Duplicate Record Detection Method Based on Genetic Neural Network

在线阅读下载全文

作  者:肖蕾[1] 郭乐江[1] 胡亚慧[1] 程敏[1] 

机构地区:[1]空军雷达学院,武汉430019

出  处:《舰船电子工程》2011年第2期168-170,176,共4页Ship Electronic Engineering

摘  要:设计实现了一个相似重复记录检测系统,该系统包括预处理模块、聚类模块、字段匹配模块和记录匹配模块,支持聚类算法和字段匹配算法的定制扩充。并通过实验对比了几种著名的算法,实验结果表明该系统提高了相似重复记录检测的精确度。An extensible duplicates detecting system is designed and implemented. This system includes data preparation module, clustering module, field matching module and record matching module. The working principle and implementa- tion mechanism in process of the four modules are given respectively in this dissertation. In our experiments, we compare the performance of our method with some famous approximately duplicate records detecting algorithms. The experiment results show that the system improved the precision.

关 键 词:遗传神经网络 相似重复记录检测系统 聚类算法 字段匹配算法 

分 类 号:TN958[电子电信—信号与信息处理]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象