基于瓶颈特征的藏语拉萨话连续语音识别研究  被引量:9

Study on Continuous Speech Recognition Based on Bottleneck Features for Lhasa-Tibetan Dialect

在线阅读下载全文

作  者:周楠[1] 赵悦[1] 李要嫱 徐晓娜[1] 才旺拉姆 吴立成[1] ZHOU Nan;ZHAO Yue;LI Yaoqiang;XU Xiaona;CAIWANG Lamu;WU Licheng(School of Information Engineering,Minzu University of China,Beijing 100081)

机构地区:[1]中央民族大学信息工程学院,北京100081

出  处:《北京大学学报(自然科学版)》2018年第2期249-254,共6页Acta Scientiarum Naturalium Universitatis Pekinensis

基  金:教育部人文社会科学规划基金(15YJAZH120);中央民族大学双一流学科建设项目资助

摘  要:基于从深度神经网络提取的瓶颈特征具有语音长时相关性和紧凑表示的特点,将瓶颈特征及其与MFCC的复合特征用于藏语连续语音识别任务中,可以代替传统的MFCC特征进行GMM-HMM声学建模。在藏语拉萨话连续语音识别任务中的实验表明,瓶颈特征的复合特征取得比深度神经网络后验特征和单瓶颈特征更好的识别表现。The bottleneck features extracted from deep neural network not only have long term contextdependence and compact representation of speech signal,but also can replace the traditional MFCC features for GMM-HMM acoustic modeling.The authors apply bottleneck features and their concatenated features with MFCC into Lhasa-Tibetan continuous speech recognition.The experiments in Lhasa-Tibetan continuous speech recognition show that the concatenated features of bottleneck features and MFCC achieve better performance than the posterior features of deep neural network and mono-bottleneck features.

关 键 词:藏语拉萨话 连续语音识别 高斯混合–隐马尔科夫模型 瓶颈特征 深度神经网络 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象