SQL存储过程实现相似重复记录检测  被引量:3

Realization of Approximately Duplicated Records Examining Based on SQL Stored Procedure

在线阅读下载全文

作  者:侯筱婷[1] 鲁萍[1] 

机构地区:[1]西安建筑科技大学,陕西西安710055

出  处:《软件导刊》2011年第7期28-29,共2页Software Guide

摘  要:"相似重复记录检测"是数据清洗要解决的主要问题之一,对于提高数据质量及决策可靠性起到关键作用。编写SQL存储过程脚本实现了一种相似重复记录检测算法———PCM算法,测试了算法性能,针对PCM算法时间复杂度较高的缺陷,提出了利用SQL语句优化技术改进算法执行效率。"Approximately Duplicated Records Examining" is an important problem one of data cleaning algorithms,it is helpful to improve data quality and reliability of decision.The paper composed sql stored procedure scripts to realize a kind of approximately duplicated records examining algorithm-PCM algorithm,and tested the performance of it.Thinking over the drawback of the higher time complexity of PCM algorithm,and then put forward the SQL tuning technologies to improve the executing efficiency.

关 键 词:SQL 存储过程 相似重复记录 数据清洗 

分 类 号:TP306.2[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象