情感语音

作品数:87被引量:217H指数:9
导出分析报告
相关领域:电子电信自动化与计算机技术更多>>
相关作者:杨莹春孙颖吴朝晖张雪英毛峡更多>>
相关机构:太原理工大学浙江大学平安科技(深圳)有限公司东南大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金山西省回国留学人员科研经费资助项目山西省青年科技研究基金国家高技术研究发展计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
融合大语言模型和预训练模型的少量语料说话人-情感语音转换方法
《计算机应用》2025年第3期815-822,共8页鲁超峰 陶冶 文连庆 孟菲 秦修功 杜永杰 田云龙 
国家重点研发计划项目(2023YFF0612100);青岛市关键技术攻关及产业化示范类项目(24-1-2-qljh-19-gx)。
针对很少有人将说话人转换和情感转换结合起来研究,且实际场景中的目标说话人情感语料通常很少,不足以从头训练一个强泛化性模型的问题,提出一种融合大语言模型和预训练情感语音合成模型的少量语料说话人-情感语音转换(LSEVC)方法。首先...
关键词:少量语料 说话人-情感语音转换 大语言模型 预训练情感语音合成模型 微调 
情感语音合成综述被引量:1
《大数据》2024年第5期56-73,共18页施昊翔 张旭龙 王健宗 程宁 肖京 
广东省重点领域研发计划“新一代人工智能”重大专项(No.2021B0101400003)。
作为语音领域一个重要的研究方向,语音合成致力于将文本转化为语音。随着深度学习技术的快速发展,语音合成的目的早已不仅仅是合成一段“能听懂”的音频这么简单,情感的加入往往能使语音变得更加具有表现力。基于此,情感语音合成在语音...
关键词:情感语音合成 情感迁移 情感强度 深度学习 
情感语音合成中的语义及韵律特征嵌入方法
《信息技术》2024年第7期26-33,共8页石凡 杨鉴 
国家自然科学基金资助项目(61961043)。
针对当前的情感语音合成方法存在合成音频容易忽略文本语义信息的问题,在文本编码器中引入BERT预训练模型,辅助编码器捕获文本语义特征,并提出了语义及韵律特征嵌入方法。缅甸语情感语料的缺乏导致模型难以合成高质量情感语音,因此,文...
关键词:缅甸语 情感语音合成 语义特征 韵律特征 微调 
基于LLM的家电智能交互控制系统研究
《家电科技》2024年第S01期125-129,共5页李伟 贾奇伟 劳春峰 宋玉军 
山东省博士后资助项目-基于大语言模型的智慧家电控制系统研究。
家电智能化研究不断推进,当前智能控制系统的研究与应用实践中存在诸多影响用户体验的技术缺陷。针对智能语音交互控制的不足,研究并提出基于大语言模型(Large Language Model,LLM)的智能家电控制系统,内容重点聚焦于大语言模型在家电...
关键词:家电智能化 大语言模型 语音情感识别 情感语音合成 
基于迁移学习双阶段训练的情感语音克隆技术
《计算机工程与设计》2024年第5期1533-1540,共8页李囡 郭浩 相洁 
国家自然科学基金项目(61876124、61873178);山西省科技厅基础研究基金项目(20210302123129、20210302124166、20210302123099)。
为解决传统基于SV2TTS架构的语音克隆系统合成语音缺乏丰富表达能力的问题,提出一种基于迁移学习双阶段训练说话人编码器的情感语音克隆方法。在说话人识别技术基础上,利用迁移学习,对说话人编码器进行音色克隆训练;在情感克隆训练阶段...
关键词:迁移学习 情感语音克隆 情感语音合成 双阶段训练 说话人识别 说话人编码 参数微调 
普通话多模态情感语音数据库构建与评测
《复旦学报(自然科学版)》2024年第1期18-31,共14页李良琦 张雪英 段淑斐 肖仲喆 贾海蓉 梁慧芝 
国家自然科学基金青年科学基金(12004275);山西省应用基础研究计划面上自然基金(20210302123186);山西省留学人员科技活动择优资助项目(20200017);太原理工大学引进人才科研启动基金(tyut-rc201405b)。
本文设计并建立了一个包含发音运动学、声学、声门和面部微表情的多模态情感语音汉语普通话数据库,分别从语料设计、被试选择、录制细节和数据处理等环节进行了详细的描述,其中信号被标记为离散情感标签(中性、愉悦、高兴、冷漠、愤怒...
关键词:情感语音数据库 多模态情感识别 维度情感空间 三维电磁发音仪 电子声门仪 
藏语情感语音数据库构建被引量:2
《北京大学学报(自然科学版)》2023年第5期773-781,共9页彭毛扎西 才智杰 才让卓玛 
国家自然科学基金(61966031);青海省科技厅项目(2019-SF-129);青海省藏文信息处理与机器翻译重点实验室(2020-ZJ-Y05)资助。
针对目前藏语语音情感类型划分不够细致,语音情感分析数据库规模较小的问题,在分析汉、英等语言语音情感类型划分方案及数据库基础上,提出一种藏语情感语音数据库构建方案,包括藏语语音情感分类、情感语音采集、情感语音标注以及有效性...
关键词:语音信号处理 藏语 情感语音 数据库 
基于条件变分自编码器的端到端情感语音合成方法被引量:4
《信号处理》2023年第4期678-687,共10页张建明 彭锦涛 贾洪杰 毛启容 
国家自然科学基金重点项目(U1836220);国家自然科学基金面上项目(62176106);国家自然科学基金青年项目(61906077);江苏省重点研究开发计划(BE2020036);江苏省自然科学基金青年项目(BK20190838);中国博士后科学基金项目(2020T130257,2020M671376)。
情感语音合成作为语音合成的一个重要分支,在人机交互领域得到了广泛的关注。如何获得更好的情感嵌入并有效地将其引入到语音合成声学模型中是目前主要存在的问题。表达性语音合成往往从参考音频中获得风格嵌入,但只能学习到风格的平均...
关键词:情感语音合成 条件变分自编码器 端到端 Tacotron 
手语到情感语音的转换
《计算机工程与科学》2022年第10期1869-1876,共8页王伟喆 郭威彤 杨鸿武 
国家自然科学基金(62067008,31860285);甘肃省自然科学基金(21JR7RA117);甘肃省教育科学“十三五”规划2020年度重点课题GS[2020]GHBZ190。
为了解决语言障碍者与健康人之间的交流障碍问题,提出了一种基于神经网络的手语到情感语音转换方法。首先,建立了手势语料库、人脸表情语料库和情感语音语料库;然后利用深度卷积神经网络实现手势识别和人脸表情识别,并以普通话声韵母为...
关键词:手势识别 人脸表情识别 情感语音合成 神经网络 手语到语音转换 语言障碍者 
基于深度学习的中文情感语音合成方法被引量:5
《自动化与仪器仪表》2022年第9期10-15,共6页王智 刘银华 
语音合成是人机交互的组成部分,并在该过程中起到了闭环的作用。人在说话时能表现出自己的情绪状态,如高兴、悲伤、愤怒等,在现有的语音合成模型中没有得到充分体现,致力于合成出具有情感特征的中文语音,提出了一种中文情感语音合成方法...
关键词:语音合成 情感 深度学习 神经网络 
检索报告 对象比较 聚类工具 使用帮助 返回顶部