基于改进型遗传神经网络的相似重复记录检测  被引量:3

Genetic Neural Network for Detection of Approximately Duplicate Records

在线阅读下载全文

作  者:吴庆辉[1] 蔡海洋[2] 吕精巧[3] 

机构地区:[1]解放军三七一中心医院,河南新乡453002 [2]新乡医学院,河南新乡453003 [3]新乡医学院图书馆,河南新乡453003

出  处:《计算机测量与控制》2011年第5期1021-1023,共3页Computer Measurement &Control

基  金:河南省科技计划重点项目(102102210191);河南省教育厅自然科学研究资助计划项目(2009A520013)

摘  要:本文提出一种基于遗传神经网络的相似重复记录检测方法,充分利用了神经网络的非线性映射和遗传算法的全局优化特性,将基于学习的思想和进化的思想有效结合并应用到重复记录检测中,避开了传统方法计算属性权重的问题,并对遗传神经网络进行改进。实验结果表明本文方法能够有效地解决大数据量的相似重复记录检测问题,不仅具有好的检测精度,而且具有很好的时间效率。This paper presents a genetic neural network for detection of approximately duplicate records by full use of non-linear mapping of neural networks and global optimization features of genetic algorithms.Learning-based ideas and the evolution of thinking is applied to the detection of duplicate records,avoiding the traditional method attribute weight problem.Experimental results show that this method can effectively solve the large data volume of approximately duplicated records detection of problems,not only has good detection accuracy,but also has good time efficiency.

关 键 词:相似重复记录 遗传算法 神经网络 数据清洗 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象