基于BERT的多模型融合的Web攻击检测方法  

Web Attacks Detection Method Based on BERT with Multi-Model Fusion

在线阅读下载全文

作  者:袁平宇 邱林[1] YUAN Pingyu;QIU Lin(School of Computer Science,Yangtze University,Jingzhou 434023,Hubei,China)

机构地区:[1]长江大学计算机科学学院,湖北荆州434023

出  处:《计算机工程》2024年第11期197-206,共10页Computer Engineering

基  金:湖北高校2020省级教研项目(2020418)。

摘  要:传统Web攻击检测方法准确率不高,不能有效防范Web攻击。针对该问题,提出一种基于变换器的双向编码器表示(BERT)的预训练模型、文本卷积神经网络(TextCNN)和双向长短期记忆网络(BiLSTM)多模型融合的Web攻击检测方法。先将HTTP请求进行预处理,再通过BERT进行训练得到具备上下文依赖的特征向量,并用TextCNN模型进一步提取其中的高阶语义特征,作为BiLSTM的输入,最后利用Softmax函数进行分类检测。在HTTP CSIC 2010和恶意URL检测两个数据集上对所提方法进行验证,结果表明,与支持向量机(SVM)、逻辑回归(LR)等传统的机器学习方法和现有较新的方法相比,基于BERT的多模型融合的Web攻击检测方法在准确率、精确率、召回率和F1值指标上均表现更优(准确率和F1值的最优值都在99%以上),能准确检测Web攻击。Traditional Web attack detection methods have a low accuracy and cannot effectively prevent Web attacks.In this regard,we propose a detection method for Web attacks based on the multi-model fusion of converter-based Bidirectional Encoder Representations from Transformer(BERT)pre-training model,Text Convolutional Neural Network(TextCNN),and Bidirectional Long Short-Term Memory(BiLSTM)network.Initially,an HTTP request is preprocessed,followed by BERT training to obtain context-dependent feature vectors.Then,the TextCNN model is used to further extract higher-order semantic features as BiLSTM inputs,and the Softmax function is used for classification detection.The proposed BERT-based multi-model fusion Web attack detection method is verified using two datasets:HTTP CSIC 2010 and malicious URL detection.Compared with traditional machine learning methods,such as the Support Vector Machine(SVM),Logistic Regression(LR),and existing newer methods,the BERT-based multi-model fused Web attack detection method has better accuracy,precision,recall,and F1 value indicators,with a maximum accuracy and F1 score of more than 99%,and can better detect Web attacks.

关 键 词:Web攻击检测 基于变换器的双向编码器表示 多模型融合 HTTP请求 文本卷积神经网络 双向长短期记忆网络 

分 类 号:TP309[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象