检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]南京航空航天大学计算机科学与技术学院,南京210016
出 处:《计算机工程与应用》2016年第12期64-68,共5页Computer Engineering and Applications
基 金:国家自然科学基金(No.61202350)
摘 要:XML文档聚类在众多数据应用领域都具有重要作用。基于特征偏好的XML文档聚类算法是对XML文档进行特征选择,将XML文档描述为n维特征向量,再结合CFP(Clustering with Feature order Preference)算法,根据特征偏好为其赋予权重,每次迭代聚类过程中进行权重的更新。实验结果表明当CFP算法中的特征偏好权重和XML文档向量化时所用的层次权重设定相结合时,可弥补XML文档向量化时的弊端,提高了XML文档聚类的精度。Clustering for XML documents plays important roles in many data application domains. The algorithm of clus-tering for XML documents with feature order preference selects features from XML documents, represents XML documents as vectors in an abstract n-dimensional feature space, sets weights for each feature according to the feature order preference, and updates weights in each iterative clustering process. Experimental results show that when the feature order preference in CFP(Clustering with Feature order Preference)combines with the level weight used in the XML document representation, this application can offset the shortcomings when vectorizing XML documents and improve the precision of clustering for XML documents.
关 键 词:可扩展标记语言(XML)文档聚类 层次权重 特征偏好
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222