检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]上海交通大学电子信息学院,上海200030 [2]北京工业大学计算机学院,北京100044
出 处:《中文信息学报》2000年第4期42-47,共6页Journal of Chinese Information Processing
基 金:国家 8 6 3项目!(86 3- 30 6 -ZD0 3- 0 4- 1)
摘 要:本文给出了一种适用中文全文检索系统的压缩模型 ,使传统的LZW模型能适用于大字符集语言源文本。方法的关键是通过引入切割标记控制字典多叉树的节点的无限扩大。对文件的检索直接在压缩文件上进行 ,因而可较大地提高检索效率。We propose an efficient compression scheme for Chinese text which is based on the useful LZW method.The general purpose compression utilities is not suited for Chinese text for its large alphabet.The key technique in our scheme is“Chinese words segment signs”which could reduce the size of the tree dictionary.The retrieve of the document is processed in the compressed file directly,therefore,allowing faster search at the same time.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.40