检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:徐永刚 孙琦炬 李凡甲 程健维[3] 戴佳俊 XU Yonggang;SUN Qixuan;Ll Fanjia;CHENG Jianwei;DAI Jiajun(School of Information and Control Engincerimg,China University of Mining and Technology,Xuzhou 221116,Jiangsu,China;School of Information Engineering(School of Big Data),Xuzhou University of Technology,Xuzhou 221000,Jiangsu,China;School of Safety Engineering,China University of Mining and Technology,Xuzhou 221116,Jiangsu,China)
机构地区:[1]中国矿业大学信息与控制工程学院,江苏徐州221116 [2]徐州工程学院信息工程学院(大数据学院),江苏徐州221000 [3]中国矿业大学安全工程学院,江苏徐州221116
出 处:《计算机工程》2025年第4期281-292,共12页Computer Engineering
基 金:新疆维吾尔自治区重点研发任务专项(2022B03003-3);国家自然科学基金(51874299);中央高校基本科研业务费专项资金(2020CXNL02);中国矿业大“工业物联网与应急协同”创新团队资助计划(2020ZY002);徐州市科技计划项目(KC23317)。
摘 要:在基于骨架的人体行为识别领域,图卷积网络(GCN)在近年来取得了很大的进展,但现有GCN大多将时间卷积和空间卷积简单串联,导致时空特征融合效果不佳。另外,现有模型还存在无法高效提取时间特征的问题。为此,提出扩展时间和时空特征融合图卷积网络(ETFF-GCN)。该网络采用通道聚合的方法对动态空间拓扑和时序特征进行一次融合,然后运用注意力机制进行二次融合,进一步增强融合效果。在此基础上,为了全面提取时序特征,采用多个不同大小的卷积核构建时域图卷积,以提取多尺度和多粒度的时间特征,并引入有效压缩激励模块进行特征增强,提升特征表达能力。在3个大型数据集上对所提出的方法进行评估,实验结果表明,该方法的性能优于现有的方法。In recent years,significant progress has been made in the field of skeleton-based human behavior recognition using Graph Convolutional Networks(GCNs).However,most of the existing GCNs concatenate temporal and spatial convolutions in a straightforward manner,which leads to suboptimal spatiotemporal feature fusion.In addition,existing models face challenges in terms of efficiently extracting temporal features.To address these issues,this paper proposes an Extended Temporal and spatiotemporal Feature Fusion Graph Convolutional Network(ETFF-GCN).This network employs channel aggregation to fuse dynamic spatial topology and temporal features in a two-stage fusion process,followed by the application of attention mechanisms for further enhancement.In addition,multiple convolutional kernels of varying sizes are utilized to construct temporal graph convolutions for capturing multiscale and multigranular temporal characteristics.Furthermore,an effective compression excitation module is used for feature enhancement,which leads to improved feature representation capabilities.Experiments on three large datasets demonstrate that the proposed approach outperforms existing methods.
关 键 词:人体骨架行为识别 图卷积网络 时空特征融合 注意力机制 扩展时间
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222