一种基于柯西分布的视频关键帧提取方法  

在线阅读下载全文

作  者:唐雅媛[1,2] 胡斌[2] 朱晓溪 冯俊智 

机构地区:[1]湖南科技学院信息工程学院,永州425199 [2]中南大学计算机学院,长沙410083 [3]上海立达学院数字科学学院,上海201609

出  处:《湖南科技学院学报》2024年第5期19-25,共7页Journal of Hunan University of Science and Engineering

基  金:国家自然科学基金项目(62102147)

摘  要:自然视频包含的众多事件间存在着关联性和时序上的重叠特征,导致视频帧的描述语句缺乏逻辑性,且存在语义离散、主题模糊的问题。为此,采用混合2D/3D卷积网络提取视频帧的全局特征,通过柯西分布分析视频事件的时序关联性,获取事件的相关帧,称为T-MCD。实验表明,T-MCD在执行Charades数据集的视频帧描述任务时,BLEU(bilingual evaluation understudy)4个指标均优于其他方法,且ROUGE-L(recall-oriented understudy for gisting evaluation)高达0.181,效果较好。

关 键 词:混合2D/3D卷积网络 柯西分布 关键帧 

分 类 号:TP391.4[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象