检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:阮落园 黄祥林[1] 王兵 张伟娜[1] 杨丽芳[1]
机构地区:[1]中国传媒大学,北京100000 [2]北京市朝阳区中国传媒大学,北京100000
出 处:《中文科技期刊数据库(引文版)工程技术》2022年第2期131-134,共4页
摘 要:近年来,随着移动互联网的发展和移动智能终端的普及,微视频已经在社交媒体平台上广泛地传播。微视频中包含的场所信息具有重要的应用价值。本文比较了视觉和声音模态对微视频场所分类性能的影响,验证了视觉模态的重要性,同时验证了两者之间的信息互补特性。除此之外,为弥补前人对不同视觉特征提取网络考虑较少的不足,本文选用了几种典型且高效的视觉特征提取主干网络,研究了不同主干网络提取的视觉特征对微视频场所分类模型性能的影响,验证了更强的视觉特征更有利于分类任务,在最优的分类模型NNeXtVLAD+中,相比于VGG16,Inception-ResNet-v2对应的性能提升9%。
分 类 号:TM73[电气工程—电力系统及自动化]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15