基于路径权重的XML文档相似度仿真研究  

Simulation Research of XML Document Similarity Based on Path Weighting

在线阅读下载全文

作  者:赵艳妮[1,2] 郭华磊[3] 马军生[3] 

机构地区:[1]陕西职业技术学院计算机科学系,陕西西安710100 [2]西安理工大学自动化与信息工程学院,陕西西安710048 [3]西安通信学院信息服务系,陕西西安710106

出  处:《计算机技术与发展》2016年第9期197-200,共4页Computer Technology and Development

基  金:国家自然科学基金资助项目(61272284);陕西省自然科学基金(2014JM8354);陕西省教育重点实验室科技项目(13JS083)

摘  要:针对XML文档查询效率低和准确度不理想的问题,提出一种基于路径权重的树相似度算法。该算法以树节点信息相似度和树结构相似度为出发点,依据信息组织主次分明的客观规律,信息按照重要程度依次排列在树的各个层次,树节点信息自上至下重要程度逐渐减弱。根据距离根节点越近的节点表示的信息越重要,最低层信息的重要性最小的特点,依照树节点在XML文档树中的层次自动计算该节点的路径权重,克服了传统XML文档树相似度计算中树节点信息权重平均分配或手工设置的缺点,解决了XML文档树的相似度自动计算问题,实现了XML查询树与文档树的快速匹配。仿真结果表明,该算法在大量XML文档检索方面查询效率、查准率和查全率都得到有效改进。In order to realize the rapid and accurate retrieval of the XML document information, a tree similarity algorithm based on path weight is proposed. It considers the tree node information similarity and structural similarity, and the information is arranged in each level of the tree in accordance with the degree of importance by object rules of primary and secondary information organization, making the de- glee of importance for tree node information weakened from up to down. According to the characteristics that the node with closer dis- tance from the root node represents the more important information, and the lowest level of the information has minimal importance, the path weight is calculated automatically in accordance with the tree node in XML document tree level, which overcomes the disadvantage of equally distribution or manual setting for tree node information weigh in the traditional XML document, and solves the similarity calcu- lation of XML document tree, and realizes the fast matching of XML query tree and document. Simulation shows that the algorithm is im- proved in query efficiency, precision and recall.

关 键 词:相似度 路径权重 查询树 文档树 

分 类 号:TP391.9[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象