基于多尺度特征融合的视频人体动作识别  

在线阅读下载全文

作  者:朱联祥 牛文煜 王卓华 庞兆斌 ZHU Lianxiang;NIU Wenyu;WANG Zhuohua;PANG Zhaobin

机构地区:[1]西安石油大学计算机学院,陕西西安710065

出  处:《信息技术与信息化》2023年第4期126-129,共4页Information Technology and Informatization

摘  要:针对C3D网络存在的提取特征不足以及不能有效处理全局信息的问题,提出了一种融合多尺度特征提取模块的C3D网络模型。采用C3D作为基础网络,融合金字塔池化模块(pyramid pooling module, PPM)多尺度卷积层,以提取多尺度特征。然后使用注意力机制将不同尺度的特征进行加权融合,以进一步提高特征表征的能力。最后使用Softmax分类器对提取的特征进行分类。为了评估本文提出的多尺度特征融合方法,在UCF-101和HMDB-51数据集上进行了实验,并且与现有方法进行对比。实验结果表明,提出的方法分别UCF-101和HMDB-51数据集上取得了92.4%和61.9%的准确率,结果表明多尺度特征融合方法相比于原网络以及现有其他方法具有更高的识别准确率。

关 键 词:多尺度特征 金字塔池化 注意力机制 全局上下文建模 动作识别 

分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象