检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张鑫[1]
出 处:《电子测试》2017年第8期72-73,共2页Electronic Test
摘 要:为了满足对XML文档集合进行数据挖掘需求,本文提出了根据XML文档树的语义信息和结构信息来计算其结构相似度,通过结构相似度构造其结构相似度矩阵,在此基础上应用DBSCAN算法来对XML文档集合进行聚类。与其他聚类算法相比,其聚类的速度得到了很大的提高.In order to meet the demand for data mining to the XML document collection, is proposed in this paper, based on the semantic information and structure of the XML document tree information to calculate the structural similarity, the structural similarity matrix, the structural similarity based on the DBSCAN algorithm, is applied to clustering XML document collection. Compared with other clustering algorithms, the speed of clustering is greatly improved.
关 键 词:XML文档 文档聚类 DBCSAN聚类算法 结构相似度
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.191.165.88