改进的XML智能数据清洗策略  

Improved XML Intelligence Data Cleaning Strategy

在线阅读下载全文

作  者:翟学敏[1] 刘渊[1,2] 刘波[3] 毕蓉蓉[1] 

机构地区:[1]江南大学信息工程学院数字媒体创意中心,无锡214122 [2]南京理工大学计算机学院,南京210094 [3]中南大学信息学院,长沙410083

出  处:《计算机工程》2009年第4期66-68,71,共4页Computer Engineering

基  金:国家部委基础研究基金资助项目;2006年江苏省教育厅青年骨干教师计划基金资助项目

摘  要:针对XML数据的质量问题,以XML键为基础,借助多模板隐马尔可夫模型信息抽取策略与粒子群优化算法构建新的XML数据清洗方法。为了提高XML相似性数据并行检测效率,利用波函数对粒子群优化算法进行优化。仿真实验表明,与其他XML数据清洗算法相比,该方法的自适应学习能力强、人工参与程度低、计算量小,时间性能有94%左右的提升。Aiming at the quality of XML data, this paper proposes a new XML data cleaning method based on XML key, the information of multiple templates Hidden Markov Model(HMM) draw-out strategy and Particle Swarm Optimization(PSO). For boosting the parallel detection efficiency of the XML similarity records, a wave function is used to give relevant improvements to PSO. Contrasted with other XML data cleaning algorithms, simulation experiments show that the optimized algorithm has powerful adaptive learning capability, lower labor cost, less calculation and better time rate around 94%.

关 键 词:XML文档集 XML键 粒子群优化算法 数据清洗 隐马尔可夫模型 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象