检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]解放军信息工程大学电子技术学院,河南郑州450004
出 处:《计算机工程与设计》2010年第18期4001-4004,共4页Computer Engineering and Design
摘 要:针对XML数据中的孤立点问题,利用聚类分析思想和XML数据嵌套结构特性所蕴含的元素间的上下文信息,设计了一种在XML半结构数据中检测孤立点的算法。该算法把逻辑相关的结点聚集到相应的子空间中,并基于这些相关子空间计算孤立点兴趣度度量XO度量,以此来识别孤立点数据。实验结果表明,该算法在一定规模的孤立点数据下能够达到较高的识别效率。Aimed at the outliers in XML data, utilizing the clustering analysis and the context information inherent in the XML data models, a new kind of arithmetic for detecting outliers is designed in XML data, and this arithmetic assemble the logic-related node in XML data to the same subspace, and according to these the related subspace compute a interest-ness measure XO-Measure of outliers and identifyiny outliers. Experimental results show that the proposed approach is effective in identifyiny outliers in a real world XML data set with certain scale outliers.
关 键 词:XML文档 XML文档树 数据清洗 孤立点 孤立点检测
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222