基于多模态特征融合的高效性语义视频检索系统  

在线阅读下载全文

作  者:庄海[1] 

机构地区:[1]海南广播电视总台

出  处:《广播电视信息》2024年第8期16-18,共3页Radio & Television Information

摘  要:本文以“视听海南”APP为例,提出了一种基于多模态特征融合的高效性语义视频检索系统。该系统采用无监督的DBSCAN聚类分析,从高维度视频帧内容编码中筛选关键帧,并引入注意力机制和掩体动作来识别预训练网络组成的并行编码器,捕捉图像的局部空间和动作信息,利用对抗生成网络和三元组损失函数优化不同模态特征的对齐,实现高效且准确的视频检索服务。

关 键 词:多模态 视频检索 特征融合 聚类分析 

分 类 号:TP391.41[自动化与计算机技术—计算机应用技术] TP391.3[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象