检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]华侨大学计算机科学与技术学院,福建泉州362021
出 处:《计算机工程与设计》2009年第13期3205-3208,共4页Computer Engineering and Design
基 金:华侨大学科研基金项目(07HZR27)
摘 要:以XML作为研究对象,提出了一种新的基于二叉树结构的XML数据模式信息的提取方法,抽取出XML文档的所有开始和结束标记并生成相应的标记链,对标记链中结点嵌套关系进行分析生成标记二叉树,通过判断和删除标记二叉树中的冗余数据得到XML文档的最简标记树模式。实验结果表明,即使对于标记的嵌套关系非常复杂的XML文档,该算法也能够准确地抽取出相应的最简标记树模式结构,同时还生成了相应的DTD模式文件。A new algorithm based on tag binary tree for XML data mode is presented, according to the algorithm a tag list of all start tags and end ones are gotten from original xml document at first, at the same time it generate a binary tree of tags through step relationship analysis, and the final simplest binary tree of tags is gotten by judging and deleting some redundant information. The test result proved that the algorithm get a tree structure efficiently from any XML document, and generate a DTD document at the same time, even though the step relationship of elements in xml document is very complex.
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249