基于随机森林算法的通信大数据重复清洗技术  

在线阅读下载全文

作  者:杨晓娟 胡倩倩 

机构地区:[1]河南牧业经济学院

出  处:《计算机产品与流通》2024年第10期46-48,共3页COMPUTER PRODUCTS AND CIRCULATION

摘  要:随着信息技术的发展,大数据应用受到了人们的重视,实际应用产生的数据呈现高维特征,从而对大数据的分类提出了挑战。当前,通信大数据清洗领域面临的主要挑战之一是无法有效地实现滤波处理,导致清洗的效果不尽如人意。随机森林算法分类准确度高且具有处理高维数据能力,因此成为处理分类问题的优选算法。在某类样本实例数量小于其他样本数量的情况下,随机森林算法会出现分类效果不佳等一系列问题。本文介绍随机森林算法理论,构建多维分布异构存储节点分布模型,可以实现采集时的抗干扰处理。本文提出了基于随机森林算法的重复清洗技术并与传统的清洗方法进行了对比,通过实验验证了其优越性。

关 键 词:随机森林算法 异构存储 信息技术 高维数据 大数据应用 样本数量 高维特征 清洗技术 

分 类 号:TP3[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象