检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张向荣[1] ZHANG Xiang-rong(Shangluo Vocational and Technical College,Shangluo 726000,Shaanxi,China)
出 处:《湖北农业科学》2022年第22期169-173,共5页Hubei Agricultural Sciences
基 金:陕西省2018年度院级重点课题(SLZY2018005)。
摘 要:提出基于Hadoop的分布式贫困户检索架构,结合数据的特征项提取及文本聚类技术,对相似文本进行聚合,根据查询精度要求建立对应文本特征向量空间,同时,过滤关联性差的数据,使其不参与搜索,以提升系统的执行效率降低内执行速度。结果表明,贫困户检索算法查全率和查准率对比全节点遍历检索具有较高的查全率和查准率,减少访问的数据源数量,节省了系统的总体计算和网络资源,具有很大的应用推广价值。This paper proposed a distributed search algorithm for the poor based on Hadoop,which combined the data feature extraction and text clustering technology to aggregate the similar text,established the corresponding text feature vector space according to the query accuracy requirements,and filtered the data with poor correlation so that it did not participate in the search,so as to improve the execution efficiency of the system and reduce the internal execution speed.The experiment results showed that the algorithm can be combined with parameter settings to personalize the use of different application scenarios and achieve the best personalized effect,which had great application value.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.225.72.113