情感语音合成

作品数:29被引量:70H指数:5
导出分析报告
相关领域:电子电信自动化与计算机技术更多>>
相关作者:杨鸿武刘建银凌震华赵新想王敬华更多>>
相关机构:西北师范大学中国科学技术大学北京交通大学太原理工大学更多>>
相关期刊:《声学技术》《计算机工程与设计》《清华大学学报(自然科学版)》《计算机应用研究》更多>>
相关基金:国家自然科学基金国家教育部博士点基金国家重点基础研究发展计划教育部科学技术研究重点项目更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
情感语音合成综述被引量:1
《大数据》2024年第5期56-73,共18页施昊翔 张旭龙 王健宗 程宁 肖京 
广东省重点领域研发计划“新一代人工智能”重大专项(No.2021B0101400003)。
作为语音领域一个重要的研究方向,语音合成致力于将文本转化为语音。随着深度学习技术的快速发展,语音合成的目的早已不仅仅是合成一段“能听懂”的音频这么简单,情感的加入往往能使语音变得更加具有表现力。基于此,情感语音合成在语音...
关键词:情感语音合成 情感迁移 情感强度 深度学习 
情感语音合成中的语义及韵律特征嵌入方法
《信息技术》2024年第7期26-33,共8页石凡 杨鉴 
国家自然科学基金资助项目(61961043)。
针对当前的情感语音合成方法存在合成音频容易忽略文本语义信息的问题,在文本编码器中引入BERT预训练模型,辅助编码器捕获文本语义特征,并提出了语义及韵律特征嵌入方法。缅甸语情感语料的缺乏导致模型难以合成高质量情感语音,因此,文...
关键词:缅甸语 情感语音合成 语义特征 韵律特征 微调 
基于LLM的家电智能交互控制系统研究
《家电科技》2024年第S01期125-129,共5页李伟 贾奇伟 劳春峰 宋玉军 
山东省博士后资助项目-基于大语言模型的智慧家电控制系统研究。
家电智能化研究不断推进,当前智能控制系统的研究与应用实践中存在诸多影响用户体验的技术缺陷。针对智能语音交互控制的不足,研究并提出基于大语言模型(Large Language Model,LLM)的智能家电控制系统,内容重点聚焦于大语言模型在家电...
关键词:家电智能化 大语言模型 语音情感识别 情感语音合成 
基于迁移学习双阶段训练的情感语音克隆技术
《计算机工程与设计》2024年第5期1533-1540,共8页李囡 郭浩 相洁 
国家自然科学基金项目(61876124、61873178);山西省科技厅基础研究基金项目(20210302123129、20210302124166、20210302123099)。
为解决传统基于SV2TTS架构的语音克隆系统合成语音缺乏丰富表达能力的问题,提出一种基于迁移学习双阶段训练说话人编码器的情感语音克隆方法。在说话人识别技术基础上,利用迁移学习,对说话人编码器进行音色克隆训练;在情感克隆训练阶段...
关键词:迁移学习 情感语音克隆 情感语音合成 双阶段训练 说话人识别 说话人编码 参数微调 
基于条件变分自编码器的端到端情感语音合成方法被引量:4
《信号处理》2023年第4期678-687,共10页张建明 彭锦涛 贾洪杰 毛启容 
国家自然科学基金重点项目(U1836220);国家自然科学基金面上项目(62176106);国家自然科学基金青年项目(61906077);江苏省重点研究开发计划(BE2020036);江苏省自然科学基金青年项目(BK20190838);中国博士后科学基金项目(2020T130257,2020M671376)。
情感语音合成作为语音合成的一个重要分支,在人机交互领域得到了广泛的关注。如何获得更好的情感嵌入并有效地将其引入到语音合成声学模型中是目前主要存在的问题。表达性语音合成往往从参考音频中获得风格嵌入,但只能学习到风格的平均...
关键词:情感语音合成 条件变分自编码器 端到端 Tacotron 
手语到情感语音的转换
《计算机工程与科学》2022年第10期1869-1876,共8页王伟喆 郭威彤 杨鸿武 
国家自然科学基金(62067008,31860285);甘肃省自然科学基金(21JR7RA117);甘肃省教育科学“十三五”规划2020年度重点课题GS[2020]GHBZ190。
为了解决语言障碍者与健康人之间的交流障碍问题,提出了一种基于神经网络的手语到情感语音转换方法。首先,建立了手势语料库、人脸表情语料库和情感语音语料库;然后利用深度卷积神经网络实现手势识别和人脸表情识别,并以普通话声韵母为...
关键词:手势识别 人脸表情识别 情感语音合成 神经网络 手语到语音转换 语言障碍者 
一种融合多通道CycleGAN和Mixup的情感语音合成方法被引量:4
《现代电子技术》2022年第15期80-87,共8页贾宁 郑纯军 
辽宁省教育厅校际合作项目(86896244);大连市科技计划项目(2019RQ120)。
现有的循环一致性生成对抗网络(CycleGAN)提供了一个双向情感语料转化的突破,但是真实目标和转换后的语音之间仍然存在很大的差距。为了缩小这一差距,提出融合多通道CycleGAN和Mixup的情感语音合成方法,包含三个阶段:多通道CycleGAN、基...
关键词:情感语音合成 多通道CycleGAN Mixup GTLU 图像重构 损失估计 有效情感区域加重 
基于语音参数自适应的缅甸语情感语音合成
《计算机科学与应用》2022年第1期33-45,共13页刘奇云 杨鉴 谭婉琳 
相比汉语和英语,缅甸语的语音合成技术发展相对滞后,合成的语音缺乏情感。情感语音合成使机器表达不再生涩,采用基于HMM声学模型的语音参数自适应方法,研究缅甸语情感语音合成。情感语音合成研究面临的一个困难是难以获取大规模的情感...
关键词:缅甸语 MFA音子自动切分 情感语音合成 语音参数自适应 
情感语音合成技术或对声纹鉴定准确性产生影响被引量:6
《科技创新与应用》2018年第36期24-24,26,共2页白海莉 
声纹鉴定运用语言学、计算机科学等知识,对涉案语音和样本语音进行听觉辨识,同时运用频谱图进行综合分析,判断二者是否由同一音源发出,或者判断声音性质。声纹鉴定结果可以为侦查和诉讼活动提供线索或证据。深度学习可以促进情感语音合...
关键词:语音 声纹鉴定 深度学习 语音合成 情感语音合成 
利用说话人自适应实现基于DNN的情感语音合成被引量:4
《重庆邮电大学学报(自然科学版)》2018年第5期673-679,共7页智鹏鹏 杨鸿武 宋南 
国家自然科学基金(11664036;61263036);甘肃省高等学校科技创新团队项目(2017C-03)~~
为了提高情感语音合成的质量,提出一种采用多个说话人的情感训练语料,利用说话人自适应实现基于深度神经网络的情感语音合成方法。该方法应用文本分析获得语音对应的文本上下文相关标注,并采用WORLD声码器提取情感语音的声学特征;采用...
关键词:情感语音合成 深度神经网络 说话人自适应训练 WORLD声码器 隐马尔可夫模型 
检索报告 对象比较 聚类工具 使用帮助 返回顶部