视频语义分析两级多模式融合算法  被引量:1

Two Level Multimodal Fusion Algorithm for Semantic Video Analysis

在线阅读下载全文

作  者:魏维[1] 李千目[1] 刘凤玉[1] 许满武[2] 

机构地区:[1]南京理工大学计算机科学与技术系,南京210094 [2]南京大学计算机科学与技术系,南京210008

出  处:《中国图象图形学报》2007年第5期893-898,共6页Journal of Image and Graphics

基  金:国家自然科学基金项目(60273035);江苏省科技攻关项目(BE2003064)

摘  要:为了全面准确地获取视频高层语义信息,提出了一种基于仿生的视频语义分析两级多模式融合算法。该算法仿照人脑多感觉融合机理,先将视频中多模式特征按不同类别划分为组,然后对每一组中的多模低层特征用层次隐马尔可夫模型(HHMM)进行数据融合;同时将以似然率表示的多个低层融合结果作为高层融合的输入,再通过基于核的非线性算法把输入空间变换到高维特征空间;最后在特征空间中求取最优线性分类面,即可得到最终的多模式两级融合结果。实验表明,该方法不仅能有效融合视频中的多模式特征,而且能获取全面、准确的高层语义信息。To extract video semantic concepts combing different modalities, a two level multimodal fusion method for video semantic concept analysis is proposed. Muhimodal features of video are divided into several groups. The fact that each group of has distinct features, a hierarchical hidden Markov models ( HHMM ) is constructed for the purpose of first-level fusion. Then outputs of first-level fusion are combined using a kernel function, by which a hyper-plane with better classification for video semantic concept is obtained. The results of experiments comparing to other fusion methods support that the two-level fusion method utilizes different modal feature in semantic concept analysis, and could effectively combine muhimodal features.

关 键 词:多模式融合 视频语义概念 多层次分析 决策融合 

分 类 号:TP391.41[自动化与计算机技术—计算机应用技术] TP18[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象