检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《沈阳师范大学学报(自然科学版)》2016年第4期473-478,共6页Journal of Shenyang Normal University:Natural Science Edition
基 金:辽宁省教育厅科学研究一般项目(L2012388)
摘 要:提出了XML文档的一种start-end-type(SET)编码方法,SET编码基于起止编码的思想,并把起止编码的三元组(start,end,level)改进为四元组(start,end,level,type),增加了表示XML文档中结点类型的type值。对四元组中的前3个值提出了新的实现算法,而第4个元素type值由前3个元素的值自动计算出来。SET编码不仅可以快速判断出结点之间的祖先/后代、父亲/孩子关系,而且还可以根据type值快速判断出XML文档中各结点的类型。经过实验测试,SET编码不仅具有良好的编码性能,还能根据各结点类型对XML数据进行实体识别,为进一步研究根据实体类型对XML数据进行查询提供条件。In the present paper,a start-end-type(SET)coding method in the treatment of XML document is proposed based on the idea of start-end coding,and the start-end coding triplets(start,end,level)is developed into a four-tuple(start,end,level,type),which increases an XML document type node as the type value.This paper also proposes a new implementation algorithm for the first three values of the four tuple,and the type values of the fourth elements can be calculated automatically by the first three elements.SET coding not only can quickly determine the relationship between ancestor and descendant,or father and son of nodes,but also the type of XML document based on type value.After the experiment,SET coding not only has good coding performance,but also can recognize the of XML data entity according to node types,it can be the basis for the further study of XML data query according to the entity type.
关 键 词:大数据 起止编码 SET编码 深度优先遍历 实体结点
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15