检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]宁波大学通信技术研究所,浙江宁波315211 [2]浙江省移动网应用技术重点实验室,浙江宁波315211
出 处:《宁波大学学报(理工版)》2011年第3期29-33,共5页Journal of Ningbo University:Natural Science and Engineering Edition
基 金:国家科技重大专项(2011ZX0302-004-02);国家重大专项核高基项目(2009ZX01039-001-002-004);科技部公共服务平台基金(9C26243314159);浙江省科技厅项目(2009C31107);宁波大学科研基金(B00241104900)
摘 要:针对目前搜索引擎引擎系统存在的数据量庞大、访问用户高并发性和搜索延迟性的特点,提出了基于云存储的文档索引分类存储模型,并在索引数据分类存储算法实现过程中,采用基于Map/Reduce编程模型的二次索引词权重计算,以降低分类过程中的模糊粒度.通过实验验证基于该存储模型的算法不仅可以提高海量数据索引库的数据处理效率,而且在一定程度上降低了检索系统查询延迟,提高了搜索效率.The main problems of current search engine system applied on intelligent terminals are limited storage capacity with massive data,high-concurrency access of users and search delay of system.Aiming to tackling these problems,this paper proposes a cloud storage model of index classification and adopts a new index storage algorithm based on Map/Reduce programming model.The algorithm calculates the secondary weight of index term in the process of index classification in order to lower the fuzzy granularity of the classification.Based on the experimental results,the proposed storage model can not only improve the mass data processing efficiency,but also to some extent reduce query delay and ameliorate the search efficiency.
关 键 词:搜索引擎 权重 MAP/REDUCE 索引
分 类 号:TP393[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222