检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中南大学信息学院,湖南长沙410083 [2]中南大学湘雅附三医院,湖南长沙410013
出 处:《智能系统学报》2008年第3期226-233,共8页CAAI Transactions on Intelligent Systems
基 金:湖南信息职业学院科技创新资助项目(108652006011);湖南省教育厅科研基金资助项目(05c671)
摘 要:针对XML数据质量问题,以XML键为基础、借助多模板隐马尔可夫模型信息抽取策略与粒子群算法构建新的XML数据清洗方法;为了提高XML相似性数据并行检测效率,尝试利用波函数对粒子群算法进行相应优化.对比其他XML数据清洗算法,一系列仿真实验表明改进的XML数据清洗方法不仅自适应学习功能强、人工参与程度低、计算量小,而且时间性能有94%左右提升.To improve XML data quality, this paper proposes a new XML data cleaning method based on XMLkeys, the information draw-out strategy of multiple templates, the hidden Markov model ( HMM), and particle swarm optimization (PSO). To improve parallel efficiency when detecting similar XML records, a wave function is employed to improve the PSO algorithm. A series of simulations indicated that, compared with other XML data cleaning algorithms, the improved XML data cleaning algorithm has a more powerful adaptive learning capability, requires less human interaction, and reduces computational time by about 94%.
分 类 号:TP312.2[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.117.92.75