中文全文检索系统中的压缩模型和模式匹配技术  被引量:5

The Compression Scheme and Pattern Matching for Chinese Text

在线阅读下载全文

作  者:刘祖斌[1] 王永成[1] 刘椿年[2] 

机构地区:[1]上海交通大学电子信息学院,上海200030 [2]北京工业大学计算机学院,北京100044

出  处:《中文信息学报》2000年第4期42-47,共6页Journal of Chinese Information Processing

基  金:国家 8 6 3项目!(86 3- 30 6 -ZD0 3- 0 4- 1)

摘  要:本文给出了一种适用中文全文检索系统的压缩模型 ,使传统的LZW模型能适用于大字符集语言源文本。方法的关键是通过引入切割标记控制字典多叉树的节点的无限扩大。对文件的检索直接在压缩文件上进行 ,因而可较大地提高检索效率。We propose an efficient compression scheme for Chinese text which is based on the useful LZW method.The general purpose compression utilities is not suited for Chinese text for its large alphabet.The key technique in our scheme is“Chinese words segment signs”which could reduce the size of the tree dictionary.The retrieve of the document is processed in the compressed file directly,therefore,allowing faster search at the same time.

关 键 词:模式匹配 LZW模型 中文全文检索系统 压缩模型 

分 类 号:TP391.3[自动化与计算机技术—计算机应用技术] G354.4[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象