XSLC:分层编码并面向查询的XML数据压缩算法  

XSLC:Layered Coding and Query-Oriented XML Data Compression Algorithm

在线阅读下载全文

作  者:付强[1,2] 王腾蛟[1,2] 李红燕[1,3] 杨冬青[1,2] 唐世渭[1,3] 

机构地区:[1]北京大学信息科学技术学院,北京100871 [2]北京大学高可信软件技术教育部重点实验室,北京100871 [3]北京大学机器感知与智能教育部重点实验室,北京100871

出  处:《计算机科学与探索》2010年第2期145-152,共8页Journal of Frontiers of Computer Science and Technology

基  金:国家自然科学基金No.60673113;国家高技术研究发展计划(863)No.2007AA01Z191;2009AA01Z150;教育部科技创新工程重大项目培育资金项目No.708001~~

摘  要:XML(extensible markup language)文档已经被广泛用作应用程序的一个数据交换格式,针对XML数据的压缩技术也逐渐成为新的研究领域。提出XSLC(XMLstream layered-coding compression)算法,通过预先扫描DTD对数据模式进行分析,继而根据元素的父子关系进行子元素层面的编码;同时根据数据类型进行数据压缩,能够在压缩之后的文档上进行查询,因为仅需一遍压缩扫描所以可以应用于数据流环境。实验表明:XSLC算法的压缩比率和压缩时间均优于传统算法。XML documents have been widely used as a data exchange format. XML (extensible markup language) data compression technology has become a new field of research. A compression method called XSLC (XML stream layered-coding compression) is proposed to compress and decompress XML stream in real time. When DTD (document type definition) is available, XSLC can analyze the data model and encode elements according to the relationship of father node and son node, compress data part according to its type, and support query operations applied on compressed files, as for only one time of scanning data is needed, all the processes can be implemented in XML data stream environment. Experimental results show that XSLC outperforms other methods in compression ratio and compression efficiency.

关 键 词:可扩展标记语言 压缩 文档类型定义 数据流 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象