语音分离

作品数:153被引量:361H指数:9
导出分析报告
相关领域:电子电信自动化与计算机技术更多>>
相关作者:刘文举徐波郭海燕付中华张二华更多>>
相关机构:东南大学中国科学院大学太原理工大学南京理工大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金黑龙江省自然科学基金山西省自然科学基金国家教育部博士点基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于图注意力网络和门控网络的轻量级单通道语音分离方法
《信号处理》2025年第4期706-717,共12页余传旗 郭海燕 王婷婷 王景润 杨震 
国家自然科学基金(62071242)。
语音分离旨在从包含多个说话人的混合语音中分离出各个源语音,是多说话人场景下语音处理类任务的重要前端。目前,基于深度学习的语音分离取得了显著进展,但随着模型性能的不断提升的同时,模型的参数量和推理时间也显著增加。针对此问题...
关键词:语音分离 轻量级模型 图神经网络 图注意力网络 门控机制 
基于多尺度可变形注意力编码与多路径融合的未知说话人语音分离
《信号处理》2025年第4期718-729,共12页王春丽 刘素倩 陈善立 
兰州交通大学及对口支援高校(LH2023002);兰州交通大学青年基金项目(LH2019005);内蒙古重点研发及成果转化项目(2023YFSH0043,2023YFDZ0043);甘肃省重点人才项目。
针对在含有噪声和混响的复杂环境中对未知说话人语音分离任务的研究,提出了一种基于多尺度可变形注意力编码与多路径融合的未知说话人语音分离模型。现有的针对未知说话人的语音分离模型是在纯净的实验环境条件下分析的模型性能,不符合...
关键词:未知说话人语音分离 多尺度可变形注意力编码策略 多路径融合 吸引子估计 
基于小波去噪与语音分离的同声传译系统设计
《自动化与仪器仪表》2025年第1期300-303,308,共5页王萌 
陕西省教育厅项目《14世纪英国女性与文学研究》(09JK278)。
同声传译作为一项涉及语言翻译和语音识别的复杂任务,被英语翻译行业广泛应用。但该模型在实现过程中面临着实时性差、翻译准确率不高和难以处理文化差异和特定领域知识等缺陷。因此研究尝试基于语音分离技术来实现同声传译模型,并基于...
关键词:小波去噪 语音分离 同声传译系统 深度学习 
噪声环境下基于注意力的时域语音分离方法
《南京邮电大学学报(自然科学版)》2024年第6期44-52,共9页余传旗 王婷婷 郭海燕 杨震 
国家自然科学基金(62071242)资助项目。
目前,基于深度学习的时域单通道语音分离模型在无噪声场景下取得了显著的成效。然而,在含噪场景下,这些模型的编码器会将噪声特征误认为是源语音特征,影响掩码估计的准确性,导致分离性能不理想。针对此问题,提出一种基于注意力机制的时...
关键词:语音分离 通道注意力 图神经网络 图注意力网络 
基于全卷积神经网络多任务学习的时域语音分离
《信号处理》2024年第12期2228-2237,共10页孙林慧 王春艳 张蒙 
国家自然科学基金(61901227)。
基于深度神经网络时频掩码进行语音分离时,目标信号相位一般采用混合信号的相位谱,且对性别组合缺乏针对性处理,这导致分离语音的质量不佳。针对该问题,本文提出一种基于全卷积神经网络联合性别组合检测(Fully Convolutional Neural Net...
关键词:深度神经网络 语音分离 全卷积神经网络 特征融合 多任务学习 
基于多语音增强与分离的对话机器人系统设计
《自动化与仪器仪表》2024年第10期282-286,共5页袁芝妹 张华 王丽 
2021年度湖南省社会科学成果评审委员会课题《人工智能背景下高职外语类专业人才培养转型研究》(XSP21YBC363)。
为进一步提升英语语音交互机器人在复杂环境下的语音交互效果,基于语音分离技术,进行英语语音增强方法的设计,以进一步提升人机英语语音交互的效果。其中,以DPRNN作为基础的语音分离模型,并以此为基础进行优化,最终通过自适应注意力进...
关键词:语音交互 语音增强 语音分离 DPRNN 自适应注意力网络 
多说话人分离与目标说话人提取的研究现状与展望
《数据采集与处理》2024年第5期1044-1061,共18页鲍长春 杨雪 
国家自然科学基金(61831019)。
语音分离作为语音信号处理领域的前沿技术,具有重要的研究价值和广阔的应用前景。通常,麦克风拾取的信号包含有多个说话人的语音、噪声和混响。为了提升用户的听觉体验以及后端设备的处理性能,需要对混合信号进行语音分离。语音分离起...
关键词:语音分离 鸡尾酒会问题 多说话人分离 目标说话人提取 深度学习 
基于视觉模态尺度融合的语音分离方法
《仪器与设备》2024年第3期315-328,共14页朱亚峰 贾林锋 张炜 
多模态语音分离方法融合视觉和听觉信息,提高单一听觉模态的分离性能。目前视听融合机制在模态特征尺度差异的问题上研究不足,影响视觉的高维语义信息表达和分离性能。因此,提出一种基于视觉模态尺度的融合方法,通过编码器降低听觉时序...
关键词:多模态语音分离 视听融合 时序卷积 时序尺度 
基于扩张卷积和Transformer的视听融合语音分离方法
《信号处理》2024年第7期1208-1217,共10页刘宏清 谢奇洲 赵宇 周翊 
重庆市自然科学基金面上项目(CSTB2022NSCQ-MSX0990);重庆市教委科学技术研究项目(KJQN202000612)。
为了提高语音分离的效果,除了利用混合的语音信号,还可以借助视觉信号作为辅助信息。这种融合了视觉与音频信号的多模态建模方式,已被证实可以有效地提高语音分离的性能,为语音分离任务提供了新的可能性。为了更好地捕捉视觉与音频特征...
关键词:语音分离 视听融合 多头自注意力机制 扩张卷积 
相似语言环境下目标语音提取研究
《现代计算机》2024年第14期84-88,共5页王智 
针对实际应用中常见的相似语音分离问题,构建了一个新的数据库P-C以模拟相似语言环境。该数据库结合了自制的重庆方言数据集CQSpeech和公开的中文数据集THCH30,以此来研究普通话与重庆方言混合语音的分离问题。另外,为了充分利用语音特...
关键词:相似语言 语音分离 数据集 
检索报告 对象比较 聚类工具 使用帮助 返回顶部