检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]新疆大学信息科学与工程学院,新疆 乌鲁木齐 [2]新疆大学网络中心,新疆 乌鲁木齐
出 处:《计算机科学与应用》2020年第5期935-943,共9页Computer Science and Application
摘 要:针对基于机器学习的恶意网页识别中对数据集的收集和标注敏感的问题,提出了一种基于生成式对抗网络(GAN)的检测方法,并且设计了编码器,将恶意URL进行字符级编码。通过使用少量样本训练模型,通过GAN拟合真实样本的能力,生成恶意网页样本。本文在传统GAN的基础上增加了一个判别器用来判别良性和恶性网页,达到了判别恶意网页的作用。最后通过横纵对比实验,分别验证了生成数据的可行以及判别模型可以达到当前有监督分类器相当的效果。Malicious web page recognition based on machine learning is sensitive to data collection and annotation. This paper proposes a method of generating and detecting malicious web pages based on Generative Adversarial Networks (GAN). Design an encoder in order to encode malicious URL at character level. A small number of samples were used to train the model, and the ability of GAN to fit real samples was used to generate malicious web page samples. On the basis of traditional GAN, this paper adds a discriminator to discriminate benign and malignant web pages, and achieves the function of discriminating malicious web pages. Finally, the feasibility of the generated data and the effectiveness of the discriminant model with the currently supervised classifier are verified by vertical and horizontal comparison experiments.
关 键 词:恶意网页识别 机器学习 生成对抗网络 多判别器 分类
分 类 号:TP3[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7