计算机应用——文本-视觉语音合成综述  

A review of text-to-visual speech synthesis

在线阅读下载全文

作  者:王志明[1] 陶建华 

机构地区:[1]北京科技大学计算机科学与技术系,北京100083 [2]不详

出  处:《中国学术期刊文摘》2006年第8期5-5,共1页Chinese Science Abstracts(Chinese Edition)

摘  要:视觉信息对于理解语音的内容非常重要.不只是听力有障碍的人,普通人在交谈过程中也存在着一定程度的唇读,尤其是在语音质量受损的噪声环境下.正如文语转换系统可以使计算机像人一样讲话,文本-视觉语音合成系统可以使计算机模拟人类语音的双模态性,让计算机界面变得更为友好.回顾了文本-视觉语音合成的发展.文本驱动的视觉语音合成的实现方法可以分为两类:基于参数控制的方法和基于数据驱动的方法.详细介绍了参数控制类中的几个关键问题和数据驱动类中的几种不同实现方法,比较了这两类方法的优缺点及不同的适用环境.

关 键 词:文本-视觉语音合成 视位 协同发音 人脸模型 人脸动画 

分 类 号:TP391[自动化与计算机技术—计算机应用技术] TN912.33[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象