检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]南京理工大学计算机科学与技术系 [2]南京大学计算机科学与技术系,南京210008
出 处:《中国图象图形学报》2007年第1期141-147,共7页Journal of Image and Graphics
基 金:国家自然科学基金项目(60273035);江苏省科技攻关项目(BE2003064)
摘 要:为跨越语义鸿沟,提出了一种提取音频中高层语义概念的方法。该方法先用隐马尔可夫模型(HMM)建立对应于分析窗口的低层语义概念,即基本声音语义事件(basic semantic-audio event,BE);然后以音框为单位将声音信号通过短时傅里叶变换及ICA处理来得到对应于HMM模型的可观察符号;接着用贝叶斯决策排除语义窗口对应声音段中的非预定义BE后,按贝叶斯公式所得最大后验概率为准则得到此语义窗口的一个基本声音语义事件组(group of BE,)GBE;最后采用高层语义逻辑定义来描述GBE与高层声音语义概念间的联系,结合由实例训练得到的高层语义逻辑定义最终得到相应语义窗口的高层语义声音概念(high level audio semantic concept,HC)。实验表明此方法能提取与人思维中相似的高层语义概念,在一定程度上可跨越语义鸿沟。To bridge the semantic gap between audio feature and high-level semantic concept, an approach for semantic- audio content Analysis is presented in this paper. Hidden Markov model(HMM) is trained for modeling BE. In order to extract GsE corresponding to a semantic window, Bayesian decision theory is used to eliminate the analysis window not belonging to any predefined HMM. Then, each of the residual analysis windows within the semantic window is classified to BE class by criterion of maximum Bayesian posterior probability. Ignoring the order and repetition of BE, GSE is got. Logic definition of high level audio semantic concept is the connection of GSE and HC, through which HC can be extracted. The experimental results demonstrate that the proposal approach could extract HC like human thoughts, and could bridge the semantic gap to some degree.
关 键 词:声音语义内容分析 高层语义概念 语义视频分析 隐马尔可夫模型
分 类 号:TN912.34[电子电信—通信与信息系统] TP391.42[电子电信—信息与通信工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.224.59.3