融合粒子群算法改进XML数据智能清洗策略  

An intelligence data cleaning strategy for XML database using PSO

在线阅读下载全文

作  者:刘波[1] 杨路明[1] 邓云龙[2] 

机构地区:[1]中南大学信息学院,湖南长沙410083 [2]中南大学湘雅附三医院,湖南长沙410013

出  处:《智能系统学报》2008年第3期226-233,共8页CAAI Transactions on Intelligent Systems

基  金:湖南信息职业学院科技创新资助项目(108652006011);湖南省教育厅科研基金资助项目(05c671)

摘  要:针对XML数据质量问题,以XML键为基础、借助多模板隐马尔可夫模型信息抽取策略与粒子群算法构建新的XML数据清洗方法;为了提高XML相似性数据并行检测效率,尝试利用波函数对粒子群算法进行相应优化.对比其他XML数据清洗算法,一系列仿真实验表明改进的XML数据清洗方法不仅自适应学习功能强、人工参与程度低、计算量小,而且时间性能有94%左右提升.To improve XML data quality, this paper proposes a new XML data cleaning method based on XMLkeys, the information draw-out strategy of multiple templates, the hidden Markov model ( HMM), and particle swarm optimization (PSO). To improve parallel efficiency when detecting similar XML records, a wave function is employed to improve the PSO algorithm. A series of simulations indicated that, compared with other XML data cleaning algorithms, the improved XML data cleaning algorithm has a more powerful adaptive learning capability, requires less human interaction, and reduces computational time by about 94%.

关 键 词:XML键 粒子群算法 数据清洗 隐马尔可夫模型 

分 类 号:TP312.2[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象