XML数据中孤立点检测方法研究  被引量:3

Research on outlier detection in XML data

在线阅读下载全文

作  者:刘铮[1] 刘伟[1] 

机构地区:[1]解放军信息工程大学电子技术学院,河南郑州450004

出  处:《计算机工程与设计》2010年第18期4001-4004,共4页Computer Engineering and Design

摘  要:针对XML数据中的孤立点问题,利用聚类分析思想和XML数据嵌套结构特性所蕴含的元素间的上下文信息,设计了一种在XML半结构数据中检测孤立点的算法。该算法把逻辑相关的结点聚集到相应的子空间中,并基于这些相关子空间计算孤立点兴趣度度量XO度量,以此来识别孤立点数据。实验结果表明,该算法在一定规模的孤立点数据下能够达到较高的识别效率。Aimed at the outliers in XML data, utilizing the clustering analysis and the context information inherent in the XML data models, a new kind of arithmetic for detecting outliers is designed in XML data, and this arithmetic assemble the logic-related node in XML data to the same subspace, and according to these the related subspace compute a interest-ness measure XO-Measure of outliers and identifyiny outliers. Experimental results show that the proposed approach is effective in identifyiny outliers in a real world XML data set with certain scale outliers.

关 键 词:XML文档 XML文档树 数据清洗 孤立点 孤立点检测 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象