利用隐空间投影算法的模型自适应方法  

Model adaptation using the projection to latent structure algorithm

在线阅读下载全文

作  者:王晶莹[1] 王作英[1] 

机构地区:[1]清华大学电子工程系,北京100084

出  处:《清华大学学报(自然科学版)》2007年第7期1159-1161,共3页Journal of Tsinghua University(Science and Technology)

基  金:国家"八六三"高技术项目(2001AA114071)

摘  要:为了降低语音识别系统中噪声的影响,提出一种利用隐空间投影算法的模型自适应方法。该方法利用状态间的相关性提取出反映码本和待识别语音共同特性的基矢量。由于语音与噪声是相互独立的,因此,当语音识别系统中有噪声存在时,认为不能用基矢量表示的那部分余量就是噪声。与本征音方法相比,该方法可以有效地降低噪声对语音识别系统的影响。该方法在提取基矢量时利用了自适应数据,并且节省了存储空间。实验结果表明:该方法在噪声环境下相对于最大似然线性回归自适应方法有4~9百分点的提高,相对于最大后验概率和本征音方法有更大的提高。To reduce the effect of noise on speech recognition systems, this paper proposed a new model adaptation method using the projection to latent structure (PLS) algorithm. The algorithm uses correlation information between different states to extract a group of basis vectors reflecting the codebook and adaptation data characteristics. Since speech and noise are statistically independent, the noise can be subtracted from the speech. The algorithm use adaptation data when extracting basis vectors which differs from the eigenvoice method. Furthermore, it needs very little storage space. Experimental results show that the method is superior to maximum likelihood linear regression by 4%-9% and is better than maximum a posterior and the eigenvoice method.

关 键 词:信息处理 说话人自适应 隐空间投影 空间相关性 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象