基于符号化和语言模型方法的汉语方言自动辨识  被引量:3

A Study About Chinese Dialect Identification Based on Tokenization and Language Model

在线阅读下载全文

作  者:沈兆勇[1] 顾明亮[2] 

机构地区:[1]徐州师范大学语言研究所,江苏徐州221116 [2]徐州师范大学物理系,江苏徐州221116

出  处:《徐州师范大学学报(自然科学版)》2006年第2期54-57,共4页Journal of Xuzhou Normal University(Natural Science Edition)

基  金:江苏省"十五"社科基金资助项目(K3-013);江苏省高校自然科学基金资助项目(99KJB510002)

摘  要:在借鉴和改进了一种新的语种辨识方法———基于高斯混合模型(GMM)符号化和语言模型方法———的基础上,建立了一个汉语方言自动辨识系统.实验使用了一个多说话人、非特定文本、连续语音汉语方言语音库进行系统测试.在3种主要汉语方言的辨识中,15 s语料测试平均辨识率达到了90.7%.In this paper, based on using for reference and improving the techniques recently developed for language identification, the Gaussian mixture model tokenization and language model, a system of automatic identification for Chinese dialects has been established. This system was evaluated using a multi-speaker speech corpus of text-independent spontaneous speech data. An accuracy of 90. 7% is achieved in three main Chinese dialects classification test using 15 s speech sessions.

关 键 词:GMM符号化 语言模型 汉语方言自动辨识 

分 类 号:TN912.34[电子电信—通信与信息系统]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象