检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]国家计算机网络应急技术处理协调中心广西分中心,广西南宁530210
出 处:《电子元器件与信息技术》2024年第10期207-209,共3页Electronic Component and Information Technology
摘 要:赌博网站的识别难点除了本身特征多样、变化丰富外,还面临数据严重不平衡的挑战。数据严重不平衡会降低机器学习算法的性能,造成对少数类的识别率低。因此,需要针对该场景下适用的分类模型进行研究。为了解决上述问题,本文探究了数据层面方法、算法层面方法和集成方法这三类典型的不平衡数据分类问题改进策略在赌博网站识别问题上的性能表现。本文在3个实验数据集上进行了实验,结果表明,各类方法均能明显改善涉赌网站的识别性能,其中提升最大的是SMOTE-SVM,对小类的识别能力提升了38.82%,总体识别能力提升了20.07%。
分 类 号:TP393.092[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.15.3.240