基于统计建模的可训练单元挑选语音合成方法  被引量:4

在线阅读下载全文

作  者:王仁华[1] 戴礼荣[1] 凌震华[1] 胡郁[1] 

机构地区:[1]中国科学技术大学电子工程与信息科学系讯飞语音实验室,合肥230027

出  处:《科学通报》2009年第8期1133-1138,共6页Chinese Science Bulletin

基  金:国家自然科学基金(批准号:60475015;60610298);国家高技术研究发展计划(编号:2006AA01Z137;2006AA010104)资助项目

摘  要:提出了一种基于统计建模的可训练单元挑选语音合成方法.在模型训练阶段,提取训练语料库中的多种声学参数并训练各自对应的统计模型;在合成阶段,基于统计模型的最大似然准则实现语料库中最优备选单元序列的挑选;最终通过波形拼接输出合成语音.实验结果表明,该方法可以有效改善传统单元挑选与波形拼接语音合成方法在系统构建自动化程度低、对专家知识依赖性强、以及合成效果稳定性不足等方面的问题.此外,针对单元挑选语音合成的特点,提出了一种新的最小单元挑选错误准则,采用区分性模型训练方法进行模型参数的更新,实现了系统构建的全自动化,并进一步提高了合成语音的自然度.

关 键 词:语音合成 单元挑选与波形拼接 统计模型 最大似然准则 

分 类 号:TN912.33[电子电信—通信与信息系统]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象