检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]南昌工程学院理学院,江西南昌330099 [2]西北农林科技大学理学院应用数学系,陕西杨凌712100
出 处:《南昌工程学院学报》2016年第6期99-102,共4页Journal of Nanchang Institute of Technology
基 金:国家自然科学基金资助项目(71301067);江西省自然科学青年基金资助项目(20142BAB217015)
摘 要:作为人工智能算法的经典算法之一,K最近邻(KNN)在非线性、低维数据时能够取得优越的效果。但是,当维数较高时,现有数据集往往会变得较为稀疏,此时KNN需要大量训练数据才能保证精度。因此,适当的数据降维方法是改进KNN方法的重要手段。先用随机森林对训练数据集的变量进行排序,从而建立一种有效的KNN算法,并采用Boston数据集验证了该模型的有效性。As one of the classical algorithms of classification algorithm,K nearest neighbor( KNN) can obtain superior results in nonlinear and low dimensional data. However,when the dimension is high,the existing data sets tend to be sparse,and KNN needs a lot of training data to ensure the forecasting accuracy. Therefore,the appropriate dimension reduction technique is very important for improving the KNN algorithm. In this paper,random forest is used to sort the importance of the variables,and then an effective KNN algorithm is established. Finally,the proposed model is applied to the Boston data set to verify its effectiveness.
分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.20