一种使用声调映射码本的汉语声音转换方法  被引量:4

Voice Conversion with Tone Mapping Codebook of Mandarin Speech

在线阅读下载全文

作  者:左国玉 刘文举[1] 阮晓钢[2] 

机构地区:[1]中国科学院自动化所模式识别国家重点实验室,北京100080 [2]北京工业大学电子信息与控制工程学院,北京100022

出  处:《数据采集与处理》2005年第2期144-149,共6页Journal of Data Acquisition and Processing

基  金:国家自然科学基金(60172055;60121302)资助项目;北京市自然科学基金(4042025)资助项目。

摘  要:在使用高斯混合模型实现说话人语音频谱包络变换的同时,提出了一种汉语声调码本映射技术来进一步提高转换语音目标说话人特征倾向性的方法。从源语音和目标语音分别提取汉语单音节的基频曲线作为基频变换单元,作预处理和聚类后分别形成源、目标声调码本,根据时间对准原则建立了一个由源特征空间到目标特征空间的声调模式映射码本。声音转换实验评估了声调码本映射算法的性能。实验结果表明,该算法较好地反映出源说话人与目标说话人基频曲线之间的映射关系,改善了声音转换性能。With a mixture Gaussian mapping method for speech spectral envelope transformation, a Mandarin tone codebook mapping algorithm for the pitch conversion is proposed to improve the preference for target characteristics in the converted speech. The syllable pitch contours are first extracted from the source and target speech, and preprocessing and clustering operations are performed. A tone mapping codebook is obtained by associating the source codebook with the target one. Voice conversion experiments are performed to evaluate the tone codebook mapping algorithm. Results show that the method gives a good mapping between the source and target pitches, and improves the performance of voice conversion for Mandarin speech.

关 键 词:声音转换 声调映射码本 混合高斯映射 

分 类 号:TN912.3[电子电信—通信与信息系统]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象