中文全文检索系统中基于分词技术的研究被引量：1

Chinese Full-Text Retrieval System Based on Segmentation Techniques

机构地区：[1]吉林工商学院信息工程学院,长春130062 [2]吉林大学网络中心,长春130012

出　　处：《吉林大学学报（信息科学版）》2013年第3期320-323,共4页Journal of Jilin University（Information Science Edition）

基　　金：吉林省教育厅科技发展规划基金资助项目(2012373)

摘　　要：为在保证中文歧义包容和长度限制的同时提高中文全文检索的速率,在现有中文分词算法的基础上,提出了一种改进的中文分词算法。通过在算法中建立索引的过程建立文本中相关词与词库的映射,对词库进行改造,使之更好地与相关词进行映射,以便于实现中文分词。实验证明,改进的中文分词算法能降低检索耗时,是已有的分词算法的1/2和1/5,有效提高中文全文检索的速率。In order to raise the rate of Chinese text retrieval of Chinese full-text retrieval system on the basis of the Chinese ambiguity inclusiveness and length restrictions, a kind of improved Chinese word segmentation algorithm is proposed based on the existing Chinese word segmentation algorithms. In this improved algorithm the process of indexing establishment makes a mapping from related words to the thesaurus. Through the improvement to the thesaurus, a better mapping is realized. Experiments show that the improved algorithm is a more efficient Chinese text retrieval segmentation algorithm.

关键词：中文全文检索中文分词字索引

分类号：TP311[自动化与计算机技术—计算机软件与理论] G354[自动化与计算机技术—计算机科学与技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

中文全文检索系统中基于分词技术的研究被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

中文全文检索系统中基于分词技术的研究 被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

中文全文检索系统中基于分词技术的研究被引量：1