语谱图

作品数:179被引量:523H指数:11
导出分析报告
相关领域:电子电信自动化与计算机技术更多>>
相关作者:潘文林王双维张昕然赵力梁士利更多>>
相关机构:东北师范大学云南民族大学杭州电子科技大学东南大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金浙江省自然科学基金湖南省自然科学基金重庆市自然科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
结合卷积增强窗口注意力的双分支语音增强神经网络
《计算机研究与发展》2025年第4期852-862,共11页张晨辉 原之安 钱宇华 
国家自然科学基金重点项目(62136005);新一代人工智能国家科技重大专项(2021ZD0112400);山西省科技重大专项计划“揭榜挂帅”项目(202201020101006)。
在复杂环境以及突发背景噪音条件下,语音增强任务具有极大的困难和挑战.主要原因是现有的语音增强方法未能有效捕获语谱图特征,尤其是局部信息.在过去的研究中,Transformer模型更专注于音频的全局信息,而忽略了局部信息的重要性.在音频...
关键词:语音增强 双分支网络 语谱图特征 卷积增强窗口注意力 全局信息 局部信息 
语谱图在鼻内镜术后语音特征评估中的应用
《听力学及言语疾病杂志》2025年第2期124-129,共6页刘雪莱 陈知己 刘恒鑫 方红雁 胡娅琴 李晓晓 陈红江 
重庆市科卫联合医学科研项目(2022QNXM004)。
目的探讨鼻内镜术后患者语音特征的客观变化,并分析手术与声道结构变化的关系。方法前瞻性纳入2023年6~12月行鼻内镜手术患者45例,其中鼻中隔偏曲矫正术和/或鼻息肉切除术和/或鼻甲成形术组(G1组)13例,单纯鼻窦开放术组(G2组)11例,鼻窦...
关键词:鼻内镜手术 语音特征 语谱图 
基于声音信号的转辙机故障诊断研究
《铁道标准设计》2025年第2期183-190,共8页梁续继 戴胜华 
国家自然科学基金项目(61833001)。
铁路信号系统中转辙机的故障率较高,需要采用智能化解决方案对故障进行诊断。传统的解决方案基于电信号,未能充分利用机械电子设备的物理特征。针对这一问题,基于转辙机动作时的声音进行故障诊断。首先,根据转辙机的动作特性提出6种会...
关键词:转辙机 故障诊断 声音信号 特征提取 wav2vec2.0 MFCC 语谱图 
基于层级化分数阶语谱图的帕金森病构音障碍分类
《中国生物医学工程学报》2025年第1期21-33,共13页薛在发 卢辉斌 林丽琴 张涛 
国家自然科学基金(62176229);河北省重点实验室项目(202250701010046);黑龙江省自然科学基金(LH2023H029)。
构音障碍是帕金森病的早期症状之一。现有的基于深度学习的帕金森病构音障碍分类大多根据语谱图和卷积神经网络分析,但两者分别存在角度单一和感受野受限等不足,导致信息提取不充分。本研究提出了一种基于层级化分数阶语谱图的帕金森病...
关键词:帕金森病 构音障碍 分数阶语谱图 参数迁移 层级化结构 
基于YOLOv5的口吃类型检测研究
《云南民族大学学报(自然科学版)》2025年第1期84-92,共9页程振 贾嘉敏 蒋作 王欣 
国家自然科学基金(61866040)。
语言交流效率得分是量化口吃严重程度的方法,该方法需要获得口吃发生的时间,但目前相关研究仅能判断语音段中是否存在口吃,无法精确定位口吃的发生位置,不利于对口吃严重程度的判别.针对目前深度学习检测口吃类型无法可视化定位目标的问...
关键词:YOLOv5 口吃识别 语谱图 目标检测 
基于ASP-SERes2Net的说话人识别算法
《北京工业大学学报》2025年第1期42-50,共9页令晓明 陈鸿雁 张小玉 张真 
甘肃省自然科学基金资助项目(22JR5RA332);甘肃省高等教育教学成果培育项目(2021)。
为提升说话人识别的特征提取能力,解决在噪声环境下识别率低的问题,提出一种基于残差网络的说话人识别算法——ASP-SERes2Net。首先,采用梅尔语谱图作为神经网络的输入;其次,改进Res2Net网络的残差块,并且在每个残差块后引入压缩激活(sq...
关键词:说话人识别 梅尔语谱图 Res2Net 压缩激活(squeeze-and-excitation SE)注意力模块 注意力统计池化(attention statistics pooling ASP) 附加角裕度的Softmax(additive angular margin Softmax AAM-Softmax) 
基于ViT-集成学习的音乐情感识别研究
《信息技术》2025年第1期47-55,共9页吴丹 王仁武 周杰 
上海市科委软科学重点项目(19692106600)。
针对常规机器学习与深度学习方法对音乐情感识别准确率低的问题,提出一种采用视觉转换器(Vision Transformer,简称ViT)做特征提取器,使用集成学习方法做分类器的短音乐情感分类模型。构造经过严格质量把关的人工标注的短音乐数据集,将...
关键词:音乐情感识别 视觉转换器 集成学习 卷积神经网络 语谱图 
基于声纹识别的油浸式变压器局部放电故障诊断研究
《青海电力》2024年第4期36-41,共6页王理丽 李子彬 李军 王生杰 李秋阳 王子乐 杨潇洁 
油浸式变压器的局部放电会导致局部绝缘的损坏,并随着时间的推移逐渐扩大,最终导致设备的损坏或故障。为有效监测油浸式变压器的局部放电故障,以声纹识别技术为监测手段,对油浸式变压器局部放电产生的声音信号进行采集和处理,搭建局部...
关键词:变压器 声纹故障诊断 注意力机制 残差神经网络 梅尔语谱图 
基于Faster-Rcnn-Fpn算法的口吃检测及其严重程度测评
《计算机与数字工程》2024年第11期3218-3222,3228,共6页蔡雨成 潘文林 
国家自然科学基金项目(编号:61866040)资助。
目前国内对口吃的检测主要是通过语言专家的主观测评,缺少智能且客观的口吃严重程度检测的医疗辅助工具。针对这一现象,论文基于UClass口吃语料库测评儿童口吃的严重程度,使用Faster-Rcnn-Fpn深度学习算法对语谱图进行检测。实验结果表...
关键词:深度学习 Faster-Rcnn-Fpn算法 口吃 目标检测 语谱图识别 
基于声纹识别技术的绝缘子防污闪监测系统设计
《海峡科学》2024年第10期30-35,共6页黄智勇 李继辉 杨雨昕 周晨璟 张洪辉 郑源辉 林辰玮 
为解决输电线路存在的污闪危害大、防控难问题,该文提出了一种基于声纹识别技术的绝缘子防污闪监测系统。该系统通过声纹识别技术以非接触的方式实现对设备声纹的采集和初步分析,在软件端则利用梅尔语谱图算法对特征值进行识别,判断绝...
关键词:声纹识别 绝缘子 防污闪 梅尔语谱图 机器学习 
检索报告 对象比较 聚类工具 使用帮助 返回顶部