基于特征偏好的XML文档聚类算法  

Clustering XML documents based on feature order preference

在线阅读下载全文

作  者:王成勇[1] 杜庆伟[1] 孙静[1] 孙振[1] 

机构地区:[1]南京航空航天大学计算机科学与技术学院,南京210016

出  处:《计算机工程与应用》2016年第12期64-68,共5页Computer Engineering and Applications

基  金:国家自然科学基金(No.61202350)

摘  要:XML文档聚类在众多数据应用领域都具有重要作用。基于特征偏好的XML文档聚类算法是对XML文档进行特征选择,将XML文档描述为n维特征向量,再结合CFP(Clustering with Feature order Preference)算法,根据特征偏好为其赋予权重,每次迭代聚类过程中进行权重的更新。实验结果表明当CFP算法中的特征偏好权重和XML文档向量化时所用的层次权重设定相结合时,可弥补XML文档向量化时的弊端,提高了XML文档聚类的精度。Clustering for XML documents plays important roles in many data application domains. The algorithm of clus-tering for XML documents with feature order preference selects features from XML documents, represents XML documents as vectors in an abstract n-dimensional feature space, sets weights for each feature according to the feature order preference, and updates weights in each iterative clustering process. Experimental results show that when the feature order preference in CFP(Clustering with Feature order Preference)combines with the level weight used in the XML document representation, this application can offset the shortcomings when vectorizing XML documents and improve the precision of clustering for XML documents.

关 键 词:可扩展标记语言(XML)文档聚类 层次权重 特征偏好 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象