检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:施昊翔 张旭龙 王健宗 程宁 肖京 SHI Haoxiang;ZHANG Xulong;WANG Jianzong;CHENG Ning;XIAO Jing(Ping An Technology(Shenzhen)Co.,Ltd.,Shenzhen 518063,China;University of Science and Technology of China,Hefei 230026,China)
机构地区:[1]平安科技(深圳)有限公司,广东深圳518063 [2]中国科学技术大学,安徽合肥230026
出 处:《大数据》2024年第5期56-73,共18页Big Data Research
基 金:广东省重点领域研发计划“新一代人工智能”重大专项(No.2021B0101400003)。
摘 要:作为语音领域一个重要的研究方向,语音合成致力于将文本转化为语音。随着深度学习技术的快速发展,语音合成的目的早已不仅仅是合成一段“能听懂”的音频这么简单,情感的加入往往能使语音变得更加具有表现力。基于此,情感语音合成在语音中加入不同的情感并对情感进行调控,以生成灵活且准确的情感语音。从情感语音合成中的几个关键科学问题出发,分别对近几年来基于情感迁移、情感强度控制和情绪混合的发展进行了总结分析,并介绍了情感语音合成的相关数据集和评价指标,最后对情感语音合成进行了展望。As a significant research area in the field of speech technology,speech synthesis is dedicated to converting text into speech.With the rapid development of deep learning technology,the objective of speech synthesis has evolved beyond merely producing"understandable"audio.The incorporation of emotion often enhances the expressiveness of synthesized speech.Consequently,emotional speech synthesis aims to combine speech with different emotions and regulate these emotions to generate flexible and precise emotional speech.Starting from several key issues in emotional speech synthesis,this paper summarizes and analyzes the development based on emotion transfer,emotion intensity control and emotion mixing in recent years,and introduces the relevant data sets and evaluation indicators of emotion speech synthesis.Finally,the emotional speech synthesis is prospected.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7