检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国科学技术大学电子科学与技术系,合肥230026
出 处:《数据采集与处理》2007年第1期14-18,共5页Journal of Data Acquisition and Processing
摘 要:提出了一种基于概率统计模型的与语言内容无关的语种识别方法,它不需要掌握各语种的专业语言学知识就可以实现几十种语言的语种识别;并针对广播语音噪声干扰大的特点,采用GMM-UBM模型作为语种模型,提高了系统的噪声鲁棒性;由于广播语音的背景噪声不是简单的全频带加性白噪声,因此本文构建了一种基于子带GMM-UBM模型的多子系统结构的语种识别系统,后端采用神经网络进行系统级融合。本文通过对37种语言及方言的识别实验,证明了子带GMM-UBM方法的有效性。A language recognition method is proposed based on probability-statistical model. It can recognize several decade kinds of languages without professional linguistic knowledge. Aimed at the high noise of the broadcast speech, GMM-UBM is used as the language model to improve the system noise-robustness. And because the background noise of the broadcast speech is not the simply full-band Gaussian white noise, a language recognition system is built based on sub-band GMM-UBM model and subsystems structure by using neural network to fuse different subsystems. Experimental results for recognizing 37 languages and dialects verify the validity of the sub-band GMM-UBM method.
关 键 词:语种识别 语言内容无关 广播语音 子带GMM—UBM
分 类 号:TN912[电子电信—通信与信息系统]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249