检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王立彬 许成谦[1] 袁丽 Wang Libin;Xu Chengqian;Yuan Li(College of Information Science and Engineering,Yanshan University,Qinhuangdao 066004)
机构地区:[1]燕山大学信息科学与工程学院,秦皇岛066004
出 处:《高技术通讯》2021年第7期723-732,共10页Chinese High Technology Letters
基 金:国家科技重大专项(2017ZX05019001-011)资助项目。
摘 要:信息检索效率的提高可以给用户带来更好的体验。信息检索的实质是字符串匹配,针对当前字符串匹配算法效率低下的问题,本文提出一种基于位置索引的中英文快速模糊检索算法,通过直接获取被匹配串的所有位置信息,在匹配串进行匹配时可根据位置信息达到直接精确匹配,从而提升匹配效率。并在此算法基础上深入分析了基于中文的模糊匹配查找和多关键字查找。通过实验测试,该算法在数据量、数据源长度和待匹配串长度等特性评价指标上均优于一般算法。The improvement of information retrieval efficiency can bring better user experience.The essence of information retrieval is string matching.In view of the low efficiency of the current string matching algorithm,this paper proposes a fast fuzzy retrieval algorithm based on location index.By directly obtaining all the position information of the matched string,the direct and accurate matching can be achieved according to the position information when matching the matched string,thus greatly improving the matching efficiency.Based on this algorithm,the fuzzy matching search and multi keyword search based on Chinese are analyzed.The experimental results show that the algorithm is superior to the ordinary algorithm in terms of data quantity,data source length and string length to be matched and other characteristics.
关 键 词:位置索引 模糊检索 字符串匹配 快速检索 中英文检索
分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.43