基于随机森林的K最近邻算法  被引量:1

K nearest neighbor algorithm based on random forest

在线阅读下载全文

作  者:江昆[1] 白旭英[2] 车金星[1] 

机构地区:[1]南昌工程学院理学院,江西南昌330099 [2]西北农林科技大学理学院应用数学系,陕西杨凌712100

出  处:《南昌工程学院学报》2016年第6期99-102,共4页Journal of Nanchang Institute of Technology

基  金:国家自然科学基金资助项目(71301067);江西省自然科学青年基金资助项目(20142BAB217015)

摘  要:作为人工智能算法的经典算法之一,K最近邻(KNN)在非线性、低维数据时能够取得优越的效果。但是,当维数较高时,现有数据集往往会变得较为稀疏,此时KNN需要大量训练数据才能保证精度。因此,适当的数据降维方法是改进KNN方法的重要手段。先用随机森林对训练数据集的变量进行排序,从而建立一种有效的KNN算法,并采用Boston数据集验证了该模型的有效性。As one of the classical algorithms of classification algorithm,K nearest neighbor( KNN) can obtain superior results in nonlinear and low dimensional data. However,when the dimension is high,the existing data sets tend to be sparse,and KNN needs a lot of training data to ensure the forecasting accuracy. Therefore,the appropriate dimension reduction technique is very important for improving the KNN algorithm. In this paper,random forest is used to sort the importance of the variables,and then an effective KNN algorithm is established. Finally,the proposed model is applied to the Boston data set to verify its effectiveness.

关 键 词:随机森林 K最近邻 高维数据 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象