检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:马彩莎 焦立男[1] 柳有权[1] 李欣[1] MA Cai-sha;JIAO Li-nan;LIU You-quan;LI Xin(School of Information Engineering,Chang’an University,Xi’an 710018,China)
出 处:《计算机与现代化》2024年第2期75-80,120,共7页Computer and Modernization
基 金:国家科技重点研发计划项目(2018YFB1600802)。
摘 要:本文提出一个基于扩张卷积的多尺度融合行人原型和时空特征的深度自编码器网络。为了更好地利用视频中行人的时序特征,在编码器和解码器的潜在空间处添加一个双分支结构,分别是预测时空特征的递归神经网络分支和保存行人正常模式的记忆存储模块。为了增强行人特征提取,忽略背景信息影响,增加模型的泛化能力,在编码器中加入改进的空洞空间金字塔池化(Atrous Spatial Pyramid Pooling,ASPP)模块,并在卷积块中使用混合扩张卷积(Hybrid Di-lated Convolution,HDC)原则,解决行人大小变化的问题,同时在解码器中引入多级残差信道注意力机制,获取更多的上下文信息。模型在数据集USCD Ped2,CUHK Avenue的曲线下面积(Area Under the Curve,AUC)分别达到了0.982,0.928。In this paper,we propose a multi-scale deep autoencoder network based on dilated convolution,incorporating pedestrian prototypes and spatio-temporal features.To better exploit the temporal features of pedestrians in videos,a dual-branch structure is added to the potential space of the encoder and decoder,the ST-RNN branch of the recurrent neural network for predicting spatio-temporal features and the memory storage module for preserving the normal patterns of pedestrians.To enhance pedestrian feature extraction,ignore the effect of background information,and improve the generalization ability of the model,an improved atrous spatial pyramid pooling(ASPP)module is added in the encoder,the hybrid dilated convolution(HDC)principle is used in the convolution block to solve the pedestrian size variation problem,while a multi-level residual channel attention mechanism is introduced in the decoder to obtain more contextual information.The corresponding area under the ROC curve(AUC)of this model reaches 0.982,0.928 for USCD ped2,CUHK Avenue datasets,respectively.
关 键 词:混合扩张卷积 残差注意力 异常行为检测 深度自编码器
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.14.64.102