一种基于模糊聚类分析的异音混合共享模型

A fuzzy-clustering analysis based on phonetic tied-mixture HMM

机构地区：[1]上海交通大学电子工程系,上海200030

出　　处：《声学学报》2005年第5期457-461,共5页Acta Acustica

摘　　要：为减少语音识别中声学模型的参数量,提高参数训练的鲁棒性,提出了一种基于升值法模糊聚类的异音混合共享模型。在决策树结构的基础上,通过对初始三音子模型的高斯函数做模糊聚类得到该模型的高斯码本,并进一步通过对模型的方差做模糊聚类完成对方差的共享。识别实验结果表明,与相近高斯数量的传统异音混合共享模型相比,提出的异音混合共享模型的高斯权值数减少77.59%时,识别率提高7.92%;与相近参数量的三音子模型相比,方差共享的异音混合模型误识率降低了3.01%。To efficiently decrease the parameter size and improve the robustness of parameter training, a revaluing fuzzy-clustering based on Phonetic Tied-mixture HMM （PTM）, i.e. FPTM, was presented. The FPTM Gaussian code book was synthesized from all Gaussians belong to the same root node in phonetic decision tree. The fuzzy-clustering method was further used for FPTM covariance sharing. Experimental results showed that compared with the conventional PTM with approximately the same parameter size, the size of FPTM weights decreased by 77.59% and recognition rate increased by 7.92%, and compared covariance-shared FPTM with tri-phone model, the former error rate was reduced by 3.01%.

关键词：模糊聚类分析声学模型混合模型共享异音三音子模型高斯函数语音识别参数训练

分类号：TN912.34[电子电信—通信与信息系统]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

一种基于模糊聚类分析的异音混合共享模型

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

一种基于模糊聚类分析的异音混合共享模型

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索