检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:周楠[1] 赵悦[1] 李要嫱 徐晓娜[1] 才旺拉姆 吴立成[1] ZHOU Nan;ZHAO Yue;LI Yaoqiang;XU Xiaona;CAIWANG Lamu;WU Licheng(School of Information Engineering,Minzu University of China,Beijing 100081)
出 处:《北京大学学报(自然科学版)》2018年第2期249-254,共6页Acta Scientiarum Naturalium Universitatis Pekinensis
基 金:教育部人文社会科学规划基金(15YJAZH120);中央民族大学双一流学科建设项目资助
摘 要:基于从深度神经网络提取的瓶颈特征具有语音长时相关性和紧凑表示的特点,将瓶颈特征及其与MFCC的复合特征用于藏语连续语音识别任务中,可以代替传统的MFCC特征进行GMM-HMM声学建模。在藏语拉萨话连续语音识别任务中的实验表明,瓶颈特征的复合特征取得比深度神经网络后验特征和单瓶颈特征更好的识别表现。The bottleneck features extracted from deep neural network not only have long term contextdependence and compact representation of speech signal,but also can replace the traditional MFCC features for GMM-HMM acoustic modeling.The authors apply bottleneck features and their concatenated features with MFCC into Lhasa-Tibetan continuous speech recognition.The experiments in Lhasa-Tibetan continuous speech recognition show that the concatenated features of bottleneck features and MFCC achieve better performance than the posterior features of deep neural network and mono-bottleneck features.
关 键 词:藏语拉萨话 连续语音识别 高斯混合–隐马尔科夫模型 瓶颈特征 深度神经网络
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.22.117.210