一种基于LSTM的合成语音自然度评价方法的研究  被引量:8

Research on a natural sound evaluation method of synthetic speech based on LSTM

在线阅读下载全文

作  者:汤梦 朱杰[1] TANG Meng;ZHU Jie(School of Electronic Information and Electrical Engineering, Shanghai Jiaotong University, Shanghai 200240,China)

机构地区:[1]上海交通大学电子信息与电气工程学院,上海200240

出  处:《信息技术》2019年第5期41-44,共4页Information Technology

基  金:科技部重点专项课题(2017YFF0210903)

摘  要:目前的语音合成技术越来越成熟,而对于合成语音质量的度量还没有比较好的客观评价体系。文中在传统的主观评分体系基础上,分析了影响合成语音质量的关键因素,利用深度学习方法建立了合成语音质量评价系统,对汉语合成语音的自然度进行客观评价。该方法得到的语音质量评分结果与人工打分的主观评价结果相比,五分制条件下的均方根误差为0.4分,相关系数为0.68。Although the speech synthesis technology is more and more mature,there is no fairly efficient evaluation system to assess the synthetic speech quality. Based on the traditional subjective scoring system,this paper analyzes the key factors affecting the quality of synthesized speech,and establishes a synthetic speech quality evaluation system by using deep learning method to objectively evaluate the naturalness of Chinese synthesized speech. The test results show that,compared with the artificial subjective evaluation results,the RMSE of the system output is 0. 4/5 and the correlation coefficient is 0. 68.

关 键 词:合成语音 自然度 客观评价 LSTM 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象