检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]河南牧业经济学院
出 处:《计算机产品与流通》2024年第10期46-48,共3页COMPUTER PRODUCTS AND CIRCULATION
摘 要:随着信息技术的发展,大数据应用受到了人们的重视,实际应用产生的数据呈现高维特征,从而对大数据的分类提出了挑战。当前,通信大数据清洗领域面临的主要挑战之一是无法有效地实现滤波处理,导致清洗的效果不尽如人意。随机森林算法分类准确度高且具有处理高维数据能力,因此成为处理分类问题的优选算法。在某类样本实例数量小于其他样本数量的情况下,随机森林算法会出现分类效果不佳等一系列问题。本文介绍随机森林算法理论,构建多维分布异构存储节点分布模型,可以实现采集时的抗干扰处理。本文提出了基于随机森林算法的重复清洗技术并与传统的清洗方法进行了对比,通过实验验证了其优越性。
关 键 词:随机森林算法 异构存储 信息技术 高维数据 大数据应用 样本数量 高维特征 清洗技术
分 类 号:TP3[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.38