面向不平衡数据的赌博网站识别方法研究  

在线阅读下载全文

作  者:唐灵灵 阳翔 韦庆 

机构地区:[1]国家计算机网络应急技术处理协调中心广西分中心,广西南宁530210

出  处:《电子元器件与信息技术》2024年第10期207-209,共3页Electronic Component and Information Technology

摘  要:赌博网站的识别难点除了本身特征多样、变化丰富外,还面临数据严重不平衡的挑战。数据严重不平衡会降低机器学习算法的性能,造成对少数类的识别率低。因此,需要针对该场景下适用的分类模型进行研究。为了解决上述问题,本文探究了数据层面方法、算法层面方法和集成方法这三类典型的不平衡数据分类问题改进策略在赌博网站识别问题上的性能表现。本文在3个实验数据集上进行了实验,结果表明,各类方法均能明显改善涉赌网站的识别性能,其中提升最大的是SMOTE-SVM,对小类的识别能力提升了38.82%,总体识别能力提升了20.07%。

关 键 词:赌博网站 不平衡数据 仿真验证 

分 类 号:TP393.092[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象