语音转换

作品数:177被引量:267H指数:9
导出分析报告
相关领域:自动化与计算机技术电子电信更多>>
相关作者:李燕萍张燕陶建华俞一彪徐宁更多>>
相关机构:平安科技(深圳)有限公司南京邮电大学深圳市腾讯计算机系统有限公司北京百度网讯科技有限公司更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划江苏省自然科学基金浙江省自然科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
融合大语言模型和预训练模型的少量语料说话人-情感语音转换方法
《计算机应用》2025年第3期815-822,共8页鲁超峰 陶冶 文连庆 孟菲 秦修功 杜永杰 田云龙 
国家重点研发计划项目(2023YFF0612100);青岛市关键技术攻关及产业化示范类项目(24-1-2-qljh-19-gx)。
针对很少有人将说话人转换和情感转换结合起来研究,且实际场景中的目标说话人情感语料通常很少,不足以从头训练一个强泛化性模型的问题,提出一种融合大语言模型和预训练情感语音合成模型的少量语料说话人-情感语音转换(LSEVC)方法。首先...
关键词:少量语料 说话人-情感语音转换 大语言模型 预训练情感语音合成模型 微调 
基于GP-MaskGAN模型的语音转换方法
《杭州电子科技大学学报(自然科学版)》2025年第1期44-52,共9页韦凤瑜 简志华 
国家自然科学基金项目(61201301)。
为了解决转换模型训练时不稳定的问题,并提升非平行语料情况下的语音转换性能,提出了一种基于GP-MaskGAN模型的语音转换方法。该方法采用R1零中心梯度惩罚技术惩罚真实数据上的鉴别器,防止训练时远离纳什平衡,保证模型训练的稳定性;同时...
关键词:语音转换 生成对抗网络 时间掩码 R1零中心梯度惩罚 梅尔谱转换 
AI实现101种语言即时翻译
《自然杂志》2025年第1期22-22,51,共2页吴玉(译) 
科幻小说《银河系漫游指南》中的翻译动物“巴别鱼”,可能离现实更近了。美国互联网科技公司Meta的研究人员开发了一种机器学习系统,几乎可以立即将101种语言的语音翻译成36种目标语言中的任意一种。这种大规模多语言和多模态机器翻译(S...
关键词:机器翻译 科幻小说 多模态 语音翻译 语音转换 目标语言 即时翻译 互联网科技 
基于SE注意力机制与互信息量的解纠缠跨语种语音转换
《信号处理》2025年第1期183-192,共10页李燕萍 谭誌诚 胡澄阳 杨露露 邵曦 
国家科技创新2030——“新一代人工智能”重大项目(2020AAA0106200);国家自然科学基金(61936005,62001038);南京邮电大学校级自然科学基金(NY223115)。
在跨语种语音转换(Cross-Lingual Voice Conversion, CLVC)任务中,如何保留转换语音中的内容信息,同时有效地提高转换语音的相似度和自然度是目前的研究难题。传统的编码器-解码器模型应用于跨语种语音转换时,通常会对语音进行相互独立...
关键词:跨语种语音转换 SE注意力机制 互信息量 全局上下文信息 
面向风格多样化的多对多语音情感转换
《声学学报》2024年第6期1297-1303,共7页周健 罗翔宇 王华彬 郑文明 陶亮 
国家自然科学基金项目(U2003207,61902064)资助。
针对现有基于生成对抗网络的语音情感转换仍然存在情感分离不明显,且转换后的语音情感缺乏多样性问题,提出了一种面向风格多样化的多对多语音情感转换方法。该方法基于一个双生成器结构的生成对抗网络模型,通过对不同生成器的中间编码...
关键词:情感语音转换 风格多样化 生成对抗网络 情感编码 
用于提升聋哑人语音表现力的语音合成技术
《声学技术》2024年第6期843-853,共11页马皓天 洪峰 毛海全 郑立通 牟宏宇 许伟杰 
中国科学院声学研究所自主部署"前沿探索"项目(QYTS202114);中国科学院青年创新促进会(2021022)项目;上海市自然科学基金项目(22ZR1475700)。
目前,聋哑人主要通过手语的方式与健听人进行沟通,但这对未接受专业手语学习的健听人来说是一种挑战。因此,将手语转换为文本,再将文本转换成带有聋哑人音色的、健听人能理解的语音非常具有研究意义。为研究聋哑人语音合成的可行性,文...
关键词:语音合成 语音转换 语音克隆 风格迁移 
语音风格迁移研究综述
《软件导刊》2024年第11期12-24,共13页任蓬森 都云程 王洪俊 
语音风格迁移技术是在保证语音内容不变的前提下,将源说话人的语音风格或音色转换为目标说话人的语音风格或音色。为快速了解语音风格迁移关键技术最新发展,结合近几年语音风格迁移领域的国内外研究,分别选取特征提取、语料对齐、迁移...
关键词:语音风格迁移 深度学习 迁移模型 语音转换 声码器 
融合信息扰动与特征解耦的单样本语音转换
《计算机应用研究》2024年第10期3081-3086,共6页王光 刘宗泽 董浩 姜彦吉 
葫芦岛市科技计划资助项目(2023JH(1)4/02b)。
单样本语音转换的特性是利用单条目标说话人的语音样本即可实现身份的转换,但由于声学特征呈现复杂的相互作用和动态变化,现有方法难以充分将单样本语音中的说话人音色与其他声学特征解耦,导致转换音频在听觉上仍与源说话人的音色特征相...
关键词:单样本语音转换 信息扰动 特征解耦 说话人音色泄露 
基于多重互信息约束的高表现力语音转换
《计算机系统应用》2024年第9期216-225,共10页王光 刘宗泽 姜彦吉 董浩 
辽宁省教育厅面上项目(LJKZ0338);葫芦岛市科技计划(2023JH(1)4/02b);广东省科技创新战略专项市县科技创新支撑项目(STKJ2023071)。
随着语音转换在人机交互领域的广泛应用,对于获取高表现力语音的需求日益显著.当前语音转换主要通过解耦声学特征实现,侧重对内容和音色特征的解耦,很少考虑语音中混合的情感特性,导致转换音频情感表现力不足.为解决上述问题,本文提出...
关键词:语音转换 特征解耦 互信息约束 韵律建模 人机交互 
基于子带谐波一致性的语音转换反取证框架研究
《小型微型计算机系统》2024年第8期1960-1965,共6页甘子健 叶登攀 张健 
国家自然科学基金面上项目(62272485)资助.
语音转换任务指的是在保持语言内容不变的情况下,将一个说话者的声音身份转换为另一个说话者.然而现有工作很少考虑针对音频取证机器分类模型进行抗检测研究,转换音频极容易被取证模型所识别.本文提出了一种具有3个子带频谱鉴别器设计...
关键词:语音转换 语音欺骗取证 子带频谱 音频反取证 
检索报告 对象比较 聚类工具 使用帮助 返回顶部