语音活动检测

作品数:50被引量:83H指数:4
导出分析报告
相关领域:电子电信自动化与计算机技术更多>>
相关作者:陈喆殷福亮王喆李宇王金芳更多>>
相关机构:百度在线网络技术(北京)有限公司平安科技(深圳)有限公司华为技术有限公司桂林电子科技大学更多>>
相关期刊:《无线电工程》《计算机应用与软件》《小型微型计算机系统》《电脑知识与技术》更多>>
相关基金:国家自然科学基金广西壮族自治区自然科学基金江苏省自然科学基金深圳市科技计划项目更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
一种基于模拟域特征提取的语音活动检测电路
《物联网技术》2025年第5期16-20,共5页何建平 杨兵 张静 乔飞 贾凯歌 魏琦 刘玉浩 喻剑依 石匆 
国家自然科学基金资助项目(92164203);国家自然科学基金资助项目(62334006);北京市教委-铪基铁电晶体管疲劳特性提升方法的研究(9619)。
随着人工智能的发展,智能终端设备中集成的常开型传感器的数量逐渐增加。然而,这些传感器无法对无用信息进行有效的处理,浪费了大量资源且会严重影响后续数据处理的精度。为了应对边缘终端声学传感设备在追求高精度和低功耗方面所面临...
关键词:人工智能 边缘终端声学传感设备 语音活动检测 短时能量 短时过零率 混合信号域 
孤独症访谈场景下融入角色信息的说话人日志方法
《计算机科学》2025年第2期231-241,共11页王康月 程铭 谢奕香 邹小兵 李明 
国家自然科学基金面上项目(62171207);广州市重点研发计划(202007030011)。
说话人日志技术在智能语音转写领域扮演着关键的角色,其核心任务是按照说话人的身份对多人音频进行分割和聚类,以便更好地对音频内容及转写文本进行整理。在医疗访谈领域,说话人日志技术是自动化评估的前置条件。医疗交互对话领域天然...
关键词:说话人日志 角色分类 特定说话人语音活动检测 声纹特征提取 孤独症谱系障碍 
多模型融合的VoxSRC22说话人日志系统
《计算机工程与应用》2024年第10期164-172,共9页杜雨轩 周若华 
为有效解决“谁在什么时候说话”的问题,提出一种说话人日志方法。该方法由六个模块组成,包括语音活动检测(voice activity detection,VAD)、语音增强、说话人嵌入提取器、说话人聚类、重叠语音检测(overlapping speech detection,OSD)...
关键词:说话人日志 语音活动检测 声纹嵌入 说话人聚类 结果融合 
多说话人语音环境下目标说话人声纹验证方法研究被引量:2
《物联网技术》2024年第2期3-7,10,共6页陈家峥 张斌 李雅明 
声纹身份验证技术越来越多的应用于IoT智能设备中,针对多说话人语音环境,应用传统VAD模块的声纹验证系统错误拒绝率严重升高,甚至无法工作。本文从语音分离技术入手,设计实现了一种只对目标说话人触发的轻量化SD-VAD模型。首先,通过在...
关键词:物联网 声纹验证 语音分离 多说话人环境 语音活动检测(VAD) ECAPA-TDNN 
语音增强与检测的多任务学习方法研究被引量:5
《计算机工程与应用》2021年第20期197-202,共6页王师琦 曾庆宁 龙超 熊松龄 祁潇潇 
国家自然科学基金(61961009);广西自然科学基金重点项目(2016GXNSFDA380018);桂林电子科技大学认知无线电与信息处理教育部重点实验室基金(CRKL160107)。
在许多语音信号处理的实际应用中,都要求系统能够低延迟地实时处理多个任务,并且对噪声要有很强的鲁棒性。针对上述问题,提出了一种语音增强和语音活动检测(Voice Activity Detection,VAD)的多任务深度学习模型。该模型通过引入长短时记...
关键词:多任务学习 深度学习 语音增强 语音活动检测 
WebRTC降噪算法在RT1052芯片的实现与优化
《广州大学学报(自然科学版)》2020年第4期50-56,共7页郑泽鸿 张承云 
广州市教育局高校科研资助项目(202032882)。
WebRTC开源降噪算法主要用于PC或移动端的实时通信,但很多应用需要在嵌入式芯片上实现.文章以高性价比的RT1052开发板作为硬件平台,分析算法处理流程,并通过硬件浮点处理单元(FPU)和信号处理库(CMSIS-DSP)优化代码,针对原代码中语音恢...
关键词:WebRTC 降噪算法 RT1052 语音活动检测器 
数字助听器中的音频动态范围控制算法研究被引量:2
《电子器件》2020年第3期652-656,共5页丁凯星 梁瑞宇 朱霜霜 
江苏省大学生实践创新训练计划项目(201911276021Z)。
本文针对数字助听器提出一种结合语音活动检测的五段动态范围控制算法。传统的动态控制算法只能消除音频信号中携带的噪声,而无法解决播放端的高频噪声问题,而本文采用频域子带能量作为特征,用二维高斯模型进行语音噪声的似然比检验来...
关键词:数字助听器 语音活动检测 动态范围控制 子带能量 高斯模型 
儒卓力提供Redpine Signals超低功耗无线MCU
《单片机与嵌入式系统应用》2019年第6期95-95,共1页
Redpine Signals的RS14100 WiSeMCU系列是儒卓力提供的首款具有多协议无线子系统的无线安全MCU。而且,这些SoC器件和模块还具有语音活动检测(VAD)功能和多达8个电容式触摸传感器输入。RS14100系列为电池供电的物联网设备提供了业界最低...
关键词:无线安全 超低功耗 MCU 802.15.4 语音活动检测 Zigbee THREAD 无线子系统 
基于噪声分类和双自适应阈值判决的语音活动检测方法被引量:1
《工程科学与技术》2018年第4期170-178,共9页姚睿 曾泽清 杜君杰 
国家自然科学基金资助项目(61402226)
为了解决复杂背景噪声环境中语音活动检测(voice activity detection,VAD)命中率较低的问题,提出具有环境意识的VAD算法。针对常用算法中采用单阈值抗噪性差的不足,对语音帧和噪声帧相互转换过程采用不同阈值,并对两个阈值进行自适应更...
关键词:语音活动检测 双自适应阈值 噪声分类 特征联合 
基于多窗谱估计的改进的维纳滤波语音增强算法
《电子世界》2017年第7期148-148,共1页崔旭 
针对语音活动检测(VAD)噪声谱估计的算法在现实场景中(噪声谱不断的变化)难以取得理想的效果,很容易对噪声谱的估计偏小或者偏大的问题,本文提出基于改进的最小控制的递归平均算法(The improved minimum control recursion average,简称...
关键词:语音活动检测 IMCRA 维纳滤波 多窗谱估计 
检索报告 对象比较 聚类工具 使用帮助 返回顶部