基于Hadoop的精准扶贫大数据的数据挖掘研究  

Research on data mining of big data of targeted poverty alleviation based on Hadoop

在线阅读下载全文

作  者:张向荣[1] ZHANG Xiang-rong(Shangluo Vocational and Technical College,Shangluo 726000,Shaanxi,China)

机构地区:[1]商洛职业技术学院,陕西商洛726000

出  处:《湖北农业科学》2022年第22期169-173,共5页Hubei Agricultural Sciences

基  金:陕西省2018年度院级重点课题(SLZY2018005)。

摘  要:提出基于Hadoop的分布式贫困户检索架构,结合数据的特征项提取及文本聚类技术,对相似文本进行聚合,根据查询精度要求建立对应文本特征向量空间,同时,过滤关联性差的数据,使其不参与搜索,以提升系统的执行效率降低内执行速度。结果表明,贫困户检索算法查全率和查准率对比全节点遍历检索具有较高的查全率和查准率,减少访问的数据源数量,节省了系统的总体计算和网络资源,具有很大的应用推广价值。This paper proposed a distributed search algorithm for the poor based on Hadoop,which combined the data feature extraction and text clustering technology to aggregate the similar text,established the corresponding text feature vector space according to the query accuracy requirements,and filtered the data with poor correlation so that it did not participate in the search,so as to improve the execution efficiency of the system and reduce the internal execution speed.The experiment results showed that the algorithm can be combined with parameter settings to personalize the use of different application scenarios and achieve the best personalized effect,which had great application value.

关 键 词:HADOOP 大数据搜索 数据挖掘 特征项 结果集排序 

分 类 号:G807.01[文化科学—体育训练]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象