语音可懂度

作品数:42被引量:118H指数:6
导出分析报告
相关领域:电子电信自动化与计算机技术更多>>
相关作者:马建芬张雪英周健王华彬陶亮更多>>
相关机构:太原理工大学奥迪康有限公司武汉大学安徽大学更多>>
相关期刊:《计算机仿真》《声学技术》《武汉理工大学学报》《计算机工程与设计》更多>>
相关基金:国家自然科学基金安徽省自然科学基金青海省自然科学基金国家教育部博士点基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
一种基于幅度谱约束的语音可懂度增强算法
《计算机与数字工程》2025年第1期39-44,共6页赵艳磊 辛凯 
语音交流是重要的人机交互方式,然而现实生活中噪声干扰影响接收到的语音信号综合质量。因此对受到噪声污染的带噪语音进行处理,以尽可能地恢复出原始纯净语音信号、保证语音通信效果。论文围绕基于语音幅度谱约束的语音可懂度增强问题...
关键词:语音增强 语音可懂度 幅度平方谱估计 幅度谱约束 
基于伽玛通滤波器的双谱特征语音可懂度算法
《计算机工程与设计》2023年第5期1288-1296,共9页陈晓梅 王晓玮 钟波 杨佳燕 商莹莹 
国家重点研发计划基金项目(2020YFC2005200)。
针对现有的语音可懂度评价方法不能真实贴近人耳对语音的感知过程,提出一种基于人耳听觉特性的双谱特征预测语音可懂度评价(Gammatone-bspectral speech intelligibility metric, GBSIM)算法。充分利用双谱可以检测语音信号中的非线性...
关键词:语音可懂度 客观评价算法 非线性失真 听觉特性 Gammatone滤波器组 高阶统计量 双谱 
一种用于因果式语音增强的门控循环神经网络被引量:3
《计算机工程》2022年第11期77-82,共6页李江和 王玫 
国家自然科学基金(62071135);广西自然科学基金(2020GXNSFAA159004)。
传统基于深度学习的语音增强方法为了提高网络对带噪语音的建模能力,通常采用非因果式的网络输入,由此导致了固定时延问题,使得语音增强系统实时性较差。提出一种用于因果式语音增强的门控循环神经网络CGRU,以解决实时语音增强系统中的...
关键词:门控循环神经网络 固定时延 因果式语音增强 语音质量 语音可懂度 
基于SNR_(ESI)信道选择的改进IMCRA语音增强算法被引量:1
《计算机应用与软件》2022年第11期148-153,共6页卢勇 舒涛 
青年基金项目(Q2019-072)。
大部分传统的语音增强算法不能提高语音的可懂度,同时还引入了失真。要想提高语音的质量和可懂度,需要设计相应的准则保留衰减失真的有用信道,消除放大失真的不利信道。利用基于统计模型的方法结合改进的IMCRA噪声估计算法对语音进行降...
关键词:语音增强 语音可懂度 信道选择 信噪比 
采用双谱特征的语音可懂度评价算法
《声学技术》2022年第5期678-684,共7页陈晓梅 王晓玮 钟波 商莹莹 杨佳燕 
国家重点研发计划“主动健康和老龄化科技应对”专项(2020YFC2005200)课题。
针对现有的语音可懂度评价方法不能有效地处理信号在多种类型的非线性失真下的变化,提出了一种基于双谱特征的语音可懂度评价(Bispectral Speech Intelligibility Metric,BSIM)算法,用三阶统计量从语音信号的谱图中提取特征。双谱可以...
关键词:语音可懂度 客观评价算法 高阶统计 双谱 
多阶段生成器与时频鉴别器的GAN语音增强算法被引量:2
《计算机系统应用》2022年第7期179-185,共7页陈宇 尹文兵 高戈 王霄 曾邦 陈怡 
传统生成对抗网络的语音增强算法(SEGAN)将时域语音波形作为映射目标,在低信噪比条件下,语音时域波形会淹没在噪声中,导致SEGAN的增强性能会急剧下降,语音失真现象较为严重.针对该问题,提出了一种多阶段的时频域生成对抗网络的语音增强...
关键词:语音增强 生成对抗网络 低信噪比 语音质量 语音可懂度 语音识别 多阶段模型 深度学习 
基于时频域生成对抗网络的语音增强算法被引量:5
《计算机科学》2022年第6期187-192,共6页尹文兵 高戈 曾邦 王霄 陈怡 
传统基于生成对抗网络的语音增强算法(Speech Enhancement Algorithm Based on Generative Adversarial Networks,SEGAN)在时域上对语音进行增强处理,完全忽略了语音样本在频域上的分布情况。在低信噪比条件下,语音信号会淹没在噪声中,...
关键词:语音增强 生成对抗网络 时频域 低信噪比 语音质量 语音可懂度 
基于CycleGAN的语音可懂度关键技术
《计算机系统应用》2022年第6期1-9,共9页肖晶 刘佳奇 李登实 赵兰馨 王前瑞 
国家重点研发计划(1502-211100026)。
语音可懂度增强是一种在嘈杂环境中再现清晰语音的感知增强技术.许多研究通过说话风格转换(SSC)来增强语音可懂度,这种方法仅依靠伦巴第效应,因此在强噪声干扰下效果不佳. SSC还利用简单的线性变换对基频(F0)的转换进行建模,并且只映射...
关键词:深度学习 可懂度增强 连续小波变换 iMetricGAN CycleGAN 
教室声环境的分析与设计被引量:1
《电声技术》2021年第11期5-8,12,共5页唐凤台 唐艳丹 
很多商家/设计师对教室的声环境设计只关注混响时间这一项指标,而且普遍认为混响时间越低越好。针对这一现象,从影响教室声环境的三大主要因素即混响时间、背景噪声、语音可懂度展开分析,为建筑声学工作者提供相应的参考性设计指导。
关键词:教室声环境 混响时间 噪声 语音可懂度 设计指导 
面向情感变化检测的语音情感数据库被引量:1
《计算机仿真》2021年第9期448-455,共8页张会云 黄鹤鸣 李伟 
青海省自然科学基金(2016-ZJ-904);国家自然科学基金(61662062,61462072)。
语音情感数据库是进行语音情感识别研究的基础。多样化、大规模、高质量的优质的语音情感数据库对语音情感识别系统性能的提升具有重要作用。研究首先全面地分析了目前国内外使用最广泛的语音情感数据库,并将其归纳为单模态语音情感数...
关键词:语音情感识别 语音可懂度 人机交互 语音情感数据库 
检索报告 对象比较 聚类工具 使用帮助 返回顶部