检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:罗震霄[1] 和菊珍[1] 王晓玲[1] 艾丽君[2] 周傲英[1]
机构地区:[1]复旦大学计算机科学与工程系,200433 [2]上海宝信软件股份有限公司,上海201203
出 处:《计算机科学》2007年第4期106-107,144,共3页Computer Science
基 金:Sybase项目资助
摘 要:近年来,XML已成为Web上信息交流和资源共享的主要载体。但XML自身的自冗余特性限制了它的普遍应用。目前,已经有研究成果提出了XML的压缩方法。压缩的XML文档能够有效利用存储空间,节省网络带宽。在实际应用中,经常需要对压缩存储的XML文档进行更新。对于大的压缩文档,如果先解压再更新,会消耗大量时间,因此,高效的更新方法应该避免解压缩文档,在压缩的XML文档上直接进行更新操作。本文针对压缩XML文档中的数值类型(包括整型和浮点型)数据,研究了在保持压缩状态条件下如何进行有效的数值更新,提出了基于XPRESS实现的Nave数值更新方法,以及修改XPRESS编码方法实现的更为高效的Pivot数值更新方法。通过大量的实验证明,Pivot数值更新方法不仅能够提供高效的更新处理,而且保持了XPRESS的高压缩率。XML has become the de-facto standard for exchanging information on theWeb. However, XML data is recognized as verbose since its heavily repeated tags introduce significant redundancy. In order to save disk space and network bandwidth, a variety of compressing methods have been presented. Practically, Query and Update operations are two most frequently used operations. Efficient Update methods are required if there is a need to modify stored compressed XML data. In this paper, we focus on update problem of numeric data in compressed XML. Firstly, we make formal definition and classification of update types of numeric data. Secondly, we show major challenges and bottlenecks when dealing with the problem. Then, a naive update method for compressed XML data using XPRESS approach is presented. In order to improve performance, a novel method - Pivot method is designed. Experiment results with DBLP data set show that the Pivot method achieves better performance yet not comprising on compression ratio.
分 类 号:TP311.132[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.69