基于符号化和语言模型方法的汉语方言自动辨识被引量：3

A Study About Chinese Dialect Identification Based on Tokenization and Language Model

机构地区：[1]徐州师范大学语言研究所,江苏徐州221116 [2]徐州师范大学物理系,江苏徐州221116

出　　处：《徐州师范大学学报（自然科学版）》2006年第2期54-57,共4页Journal of Xuzhou Normal University(Natural Science Edition)

基　　金：江苏省"十五"社科基金资助项目(K3-013);江苏省高校自然科学基金资助项目(99KJB510002)

摘　　要：在借鉴和改进了一种新的语种辨识方法———基于高斯混合模型(GMM)符号化和语言模型方法———的基础上,建立了一个汉语方言自动辨识系统.实验使用了一个多说话人、非特定文本、连续语音汉语方言语音库进行系统测试.在3种主要汉语方言的辨识中,15 s语料测试平均辨识率达到了90.7%.In this paper, based on using for reference and improving the techniques recently developed for language identification, the Gaussian mixture model tokenization and language model, a system of automatic identification for Chinese dialects has been established. This system was evaluated using a multi-speaker speech corpus of text-independent spontaneous speech data. An accuracy of 90. 7% is achieved in three main Chinese dialects classification test using 15 s speech sessions.

关键词：GMM符号化语言模型汉语方言自动辨识

分类号：TN912.34[电子电信—通信与信息系统]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于符号化和语言模型方法的汉语方言自动辨识被引量：3

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于符号化和语言模型方法的汉语方言自动辨识 被引量：3

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于符号化和语言模型方法的汉语方言自动辨识被引量：3