基于深度网络的微视频场所分类特征提取方法研究  

在线阅读下载全文

作  者:阮落园 黄祥林[1] 王兵 张伟娜[1] 杨丽芳[1] 

机构地区:[1]中国传媒大学,北京100000 [2]北京市朝阳区中国传媒大学,北京100000

出  处:《中文科技期刊数据库(引文版)工程技术》2022年第2期131-134,共4页

摘  要:近年来,随着移动互联网的发展和移动智能终端的普及,微视频已经在社交媒体平台上广泛地传播。微视频中包含的场所信息具有重要的应用价值。本文比较了视觉和声音模态对微视频场所分类性能的影响,验证了视觉模态的重要性,同时验证了两者之间的信息互补特性。除此之外,为弥补前人对不同视觉特征提取网络考虑较少的不足,本文选用了几种典型且高效的视觉特征提取主干网络,研究了不同主干网络提取的视觉特征对微视频场所分类模型性能的影响,验证了更强的视觉特征更有利于分类任务,在最优的分类模型NNeXtVLAD+中,相比于VGG16,Inception-ResNet-v2对应的性能提升9%。

关 键 词:微视频 场所分类 特征融合 视觉特征提取 

分 类 号:TM73[电气工程—电力系统及自动化]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象