基于瓶颈特征的藏语拉萨话连续语音识别研究被引量：9

Study on Continuous Speech Recognition Based on Bottleneck Features for Lhasa-Tibetan Dialect

作　　者：周楠[1] 赵悦[1] 李要嫱徐晓娜[1] 才旺拉姆吴立成[1] ZHOU Nan;ZHAO Yue;LI Yaoqiang;XU Xiaona;CAIWANG Lamu;WU Licheng(School of Information Engineering,Minzu University of China,Beijing 100081)

机构地区：[1]中央民族大学信息工程学院,北京100081

出　　处：《北京大学学报（自然科学版）》2018年第2期249-254,共6页Acta Scientiarum Naturalium Universitatis Pekinensis

基　　金：教育部人文社会科学规划基金(15YJAZH120);中央民族大学双一流学科建设项目资助

摘　　要：基于从深度神经网络提取的瓶颈特征具有语音长时相关性和紧凑表示的特点,将瓶颈特征及其与MFCC的复合特征用于藏语连续语音识别任务中,可以代替传统的MFCC特征进行GMM-HMM声学建模。在藏语拉萨话连续语音识别任务中的实验表明,瓶颈特征的复合特征取得比深度神经网络后验特征和单瓶颈特征更好的识别表现。The bottleneck features extracted from deep neural network not only have long term contextdependence and compact representation of speech signal,but also can replace the traditional MFCC features for GMM-HMM acoustic modeling.The authors apply bottleneck features and their concatenated features with MFCC into Lhasa-Tibetan continuous speech recognition.The experiments in Lhasa-Tibetan continuous speech recognition show that the concatenated features of bottleneck features and MFCC achieve better performance than the posterior features of deep neural network and mono-bottleneck features.

关键词：藏语拉萨话连续语音识别高斯混合–隐马尔科夫模型瓶颈特征深度神经网络

分类号：TP391[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于瓶颈特征的藏语拉萨话连续语音识别研究被引量：9

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于瓶颈特征的藏语拉萨话连续语音识别研究 被引量：9

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于瓶颈特征的藏语拉萨话连续语音识别研究被引量：9