中文文本压缩的LZW算法  被引量:9

Compression algorithm LZW on Chinese text

在线阅读下载全文

作  者:陈庆辉[1,2] 陈小松[1] 韩德良[1] 

机构地区:[1]中南大学数学与统计学院,长沙410083 [2]中南大学商学院,长沙410083

出  处:《计算机工程与应用》2014年第3期112-116,共5页Computer Engineering and Applications

基  金:中南大学自由探索计划(No.201011200121)

摘  要:结合中文文本中的汉字编码方式、大字符集以及重复字串不长三个不同于英文文本的结构特点对LZW算法从读取数据方式、基本码集和字典码值输出方式三方面进行了修改。改进后的算法对中文文本的压缩比平均比LZW19提高了19%且压缩和解压速度与后者相当,其对较长的中文文本的平均压缩比已接近或者超过了压缩软件WinRAR。This paper presents a compression algorithm for Chinese text which is improved from LZW algorithm. By modify-ing LZW algorithm’s dictionary size, basic set and the output way of dictionary code, the improved algorithm LZW_CH demonstrates about 19%higher compression ratio than LZW19’s with almost the same execution speed. LZW_CH doesn’t need any pre-processing work for the compressing data. As a single compression algorithm, LZW_CH’s compression with long Chinese text has closed or exceeded the professional compression utility WinRAR.

关 键 词:中文文本 数据压缩 压缩算法 编码 LZW 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象