基于位置索引的中英文模糊检索算法研究  被引量:4

Research on fuzzy retrieval algorithm of Chinese and English based on location index

在线阅读下载全文

作  者:王立彬 许成谦[1] 袁丽 Wang Libin;Xu Chengqian;Yuan Li(College of Information Science and Engineering,Yanshan University,Qinhuangdao 066004)

机构地区:[1]燕山大学信息科学与工程学院,秦皇岛066004

出  处:《高技术通讯》2021年第7期723-732,共10页Chinese High Technology Letters

基  金:国家科技重大专项(2017ZX05019001-011)资助项目。

摘  要:信息检索效率的提高可以给用户带来更好的体验。信息检索的实质是字符串匹配,针对当前字符串匹配算法效率低下的问题,本文提出一种基于位置索引的中英文快速模糊检索算法,通过直接获取被匹配串的所有位置信息,在匹配串进行匹配时可根据位置信息达到直接精确匹配,从而提升匹配效率。并在此算法基础上深入分析了基于中文的模糊匹配查找和多关键字查找。通过实验测试,该算法在数据量、数据源长度和待匹配串长度等特性评价指标上均优于一般算法。The improvement of information retrieval efficiency can bring better user experience.The essence of information retrieval is string matching.In view of the low efficiency of the current string matching algorithm,this paper proposes a fast fuzzy retrieval algorithm based on location index.By directly obtaining all the position information of the matched string,the direct and accurate matching can be achieved according to the position information when matching the matched string,thus greatly improving the matching efficiency.Based on this algorithm,the fuzzy matching search and multi keyword search based on Chinese are analyzed.The experimental results show that the algorithm is superior to the ordinary algorithm in terms of data quantity,data source length and string length to be matched and other characteristics.

关 键 词:位置索引 模糊检索 字符串匹配 快速检索 中英文检索 

分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象