检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:吴炜[1] 苏永红[1] 李瑞轩[1] 卢正鼎[1]
机构地区:[1]华中科技大学计算机科学与技术学院,武汉430074
出 处:《计算机科学》2010年第2期65-70,共6页Computer Science
基 金:国家自然科学基金项目(60873225;60773191;70771043);国家高技术研究发展计划(863计划)项目(2007AA01Z403)资助
摘 要:针对索引创建和维护效率不高的问题,设计了一种基于DHT(Distributed Hash Table)的分布式倒排索引构建算法。该算法利用基于改进的Chord网络的分布式哈希表技术,将分词后的结果分散到多个索引服务器上并行构建索引,同时采用前驱列表定位和减少服务器定位延迟的技术,大大缩短了索引构建时间。通过采用统一调度的基于分块的增量式倒排索引更新策略,索引更新时不再需要移动已有的索引文件,提高了索引更新效率。利用周期性稳定算法和前驱列表定位提高了系统的稳定性、容错性和索引的一致性。A distributed inverted index's building method based on DHT (Distributed Hash Table) was adopted to im- prove the index's creating and updating efficiency. The arithmetic, using the DHT technology based on improved Chord network,hashes the terms and their relational information to the distributed index servers and builds the index paralle- ly. This method reduces the index' s building time through distributing a task to many nodes. The strategies of schedu- ling the index building task through chained index management servers and the incremental distributed inverted index updating method were used,which could assure index's consistency and updating efficiency.
分 类 号:TP393.01[自动化与计算机技术—计算机应用技术] TP311.132[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.14.247.147