检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国科学院研究生院,北京100080 [2]中国科学院软件研究所并行计算实验室
出 处:《计算机工程》2008年第8期53-54,58,共3页Computer Engineering
基 金:国家自然科学基金资助项目(60303020);国家自然科学基金资助重点项目(60533020);国家重点基础研究发展计划基金资助项目(2005CB321702);国家“863”计划基金资助项目(2006AA01A102,2006AA01A125);中科院与审计署合作研究基金资助项目
摘 要:查询海量数据有压缩和索引两种方法来提高速度,该文结合这两种方法提出了压缩查询的方法。FM-index是一种自索引的全文查询算法,存在内存占用过大的问题,对于复杂的查询效率也不理想。该文提出分块FM-index算法,在分块的基础上采用MPI对算法进行并行化,解决了内存占用过多的问题,达到了较好的并行效率。When dealing with massive volume data,there are two ways to achieve high performance:one is to compress and the other one is to build index.Combining these two methods,compressed query is proposed.FM-index is such a compressed self-index algorithm used for full-text query.The algorithm occupies a large amount of main memory and is unable to handle complex query efficiently.To deal with these problems,this paper proposes a blocked version FM-index algorithm and parallelizes it using MPI.The blocked algorithm greatly reduces its memory usage,while the parallel version of blocked FM-index algorithm achieves acceptable scalability.
关 键 词:压缩 自索引 FM-index算法 分块 并行
分 类 号:TP312[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222