基于动态基元选取的真实感可视语音合成系统  

An Expressive TTVS System Based on Dynamic Unit Selection

在线阅读下载全文

作  者:周密[1] 穆凯辉[1] 陶建华[1] 

机构地区:[1]中科院自动化所模式识别国家重点实验室,北京100190

出  处:《系统仿真学报》2008年第S1期420-422,426,共4页Journal of System Simulation

基  金:自然科学基金具有表现力的可视语音合成的研究(60575032)

摘  要:伴有说话者面部表情及唇动的文本-可视语音转换系统(TTVS)能够大大增强人机交互的生动性和真实感。结合当前主要的两类TTVS技术,利用数据驱动法中的动态基元拼接获得参数序列,驱动MPEG-4人脸动画模型,在保留灵活性和可移植性等优点的前提下,以较小的数据量,获得了较为生动的效果,形成了具有较高真实感的中文可视语音合成系统。TTVS system with both facial expression and lip movement can greatly enhance the vitality and expressivity of HCI.In this paper,a method of dynamic unit selection is used to synthesize parameters so as to drive a MPEG-4 face model. This method can combine the advantages of two major technologies in TTVS,thus achieve a balance between performance and the size of database,and an expressive visual-speech synthesis system with vivid expression outputs is implemented.

关 键 词:可视语音 动态基元拼接 可视韵律 MPEG-4 

分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象