检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:魏士磊 付江龙[1] 王剑雄[1] 沈英杰 WEI Shilei;FU Jiangong;WANG Jianxiong;SHEN Yingjie(Hebei University of Architecture,Zhangjiakou 075000,Hebei)
出 处:《长江信息通信》2024年第9期6-9,共4页Changjiang Information & Communications
基 金:河北省体育科技研究课题资助项目(2024QT01);校级创新基金项目(XY2023080)。
摘 要:针对运动比赛中运动员行为识别的问题,提出一种基于Swin Transformer和TCN(时域卷积网络)的混合网络模型。首先对视频进行预处理得到视频帧,使用Swin模块提取视频帧中人体动作相关的空间特征,将输出的特征图的空间尺寸压缩,纵向拼接后交给TCN模块提取视频中人体动作的时序特征。为提高通道对于行为识别结果的贡献度,在TCN残差块中加入通道注意力机制,经过分类模块后得到最终结果。实验结果显示,该模型在UCF101上动作识别准确率达到了89.7%。A hybrid network model based on Swin Transformer and TCN is proposed to address the issue of athlete behavior recognition in sports competitions.Firstly,preprocess the video to obtain the video frame,use the Swin module to extract spatial features related to human actions in the vidco frame,compress the spatial size of the output feature map,vertically concatenate it,and hand it over to the TCN module to extract temporal features of human actions in the video.To improve the contribution of channels to behavior recognition results,a channel attention mechanism is added to the TCN residual block,and the final result is obtained aftcr passing through the classification module.The experimental results show that the model achieves an action recognition accuracy of 89.7% on UCF101.
关 键 词:Swin Transformer 时域卷积网络 混合网络架构 行为识别 时序特征
分 类 号:TP391.4[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.16