基于决策树的英语焦点语音转换  

English emphatic speech conversion based on a decision tree

在线阅读下载全文

作  者:孟凡博[1,2] 吴志勇[1,2,3] 蒙美玲[2,3] 贾珈[1,2] 蔡莲红[1,2] 

机构地区:[1]清华大学计算机科学与技术系,普适计算教育部重点实验室,清华信息科学与技术国家实验室,北京100084 [2]清华大学深圳研究生院,清华大学-香港中文大学媒体科学,技术与系统联合研究中心,深圳518055 [3]香港中文大学系统工程与工程管理学系,中国香港

出  处:《清华大学学报(自然科学版)》2013年第7期1046-1051,共6页Journal of Tsinghua University(Science and Technology)

基  金:国家自然科学基金面上项目(60805008,60928005,61003094);香港特区政府研究资助局基金项目(N-CUHK414/09);国家“九七三”重点基础项目(2013CB329304);国家“八六三”高技术项目(2012AA011602)

摘  要:焦点是语言表达的重要方式,焦点重音是重要的韵律特征,实现中性语音到焦点语音的转换可以提高语音的表现力。该文提出了声学特征局部凸显度的表示方法,分析了由中性语音到焦点语音,焦点单词所属音节声学特征变化与中性语音相应音节声学特征局部凸显度的相关性,提出了一种基于决策树的英语焦点语音的转换模型。该模型采用决策树对训练语料进行聚类,所用上下文包括音节与焦点单词的相对位置以及音节在韵律结构(如韵律短语、韵律词等)中的位置。在此基础上,提出了一种基于局部凸显度的中性语音到焦点语音声学特征变化的预测算法。采用该算法后,客观实验中声学特征变化平均绝对值误差降低到0.08,主观实验表明本文提出的模型的转换语音具有更好的焦点表达效果和自然度。Emphasis is an important feature of prosody. Emphatic speech conversion techniques can improve the expressiveness of converted speech. This paper defines the local prominences (LPs) of acoustic features and then analyzes the correlations between the feature changes of the syllables of the emphasized words from neutral to emphatic speech and the LPs of the corresponding syllables of the neutral speech. An English emphatic speech conversion model is then developed based on a decision tree. This model uses the decision tree to cluster the training data. After this data clustering, an algorithm is given to predict feature changes from neutral to emphatic speech based on the LPs. Tests demonstrate that the mean average error of the model is decreased to 0.08. The naturalness and the emphasis intensity of the converted speeches are also improved.

关 键 词:语音转换 焦点语音 声学特征 韵律结构 局部凸显 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象