检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:吴鹏[1] 蒋冬梅[1] 王风娜[2] Hichem SAHLI Werner VERHELST
机构地区:[1]西北工业大学陕西省语音与图像信息处理重点实验室,西安710072 [2]布鲁塞尔自由大学电子与信息工程系
出 处:《计算机工程》2011年第22期268-269,272,共3页Computer Engineering
基 金:国家自然科学基金资助项目(60703104);陕西省自然科学基金资助项目(SJ08F28);西北工业大学基础研究基金资助项目(JC200943)
摘 要:构建一种基于发音特征的音视频双流动态贝叶斯网络(DBN)语音识别模型(AF_AV_DBN),定义节点的条件概率关系,使发音特征状态的变化可以异步。在音视频语音数据库上的语音识别实验表明,通过调整发音特征之间的异步约束,AF_AV_DBN模型能得到比基于状态的同步和异步DBN模型以及音频单流模型更高的识别率,对噪声也具有较好的鲁棒性。A multi-stream Dynamic Bayesian Network(DBN) model(AF_AV_DBN) based on Articulatory Feature(AF) is proposed for audio visual speech recognition.Conditional probability distribution of each node and the degree of asynchrony between the AFs are defined,and speech recognition experiments are carried out on an audio visual connected digit database.Compared with the audio-only AF_A_DBN model,the state synchronous DBN model and the state asynchronous DBN model,the designed AF_AV_DBN model gets the highest recognition rate under various signal to noise ratios,and is more robust to background noise.
关 键 词:动态贝叶斯网络 发音特征 音视频融合 语音识别 异步
分 类 号:TP391.42[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28