MFCC

作品数:511被引量:1833H指数:19
导出分析报告
相关领域:电子电信自动化与计算机技术更多>>
相关作者:周萍邵玉斌龙华于凤芹杜庆治更多>>
相关机构:桂林电子科技大学重庆大学清华大学杭州电子科技大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划中央高校基本科研业务费专项资金浙江省自然科学基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 学科=自动化与计算机技术x
条 记 录,以下是1-10
视图:
排序:
基于滤波器组和残差网络的欺骗语音检测
《广东技术师范大学学报》2024年第6期8-15,40,共9页王泳 于拴帅 杨继臣 阳建华 陈兵 
国家自然科学基金(61672173);国家自然科学基金(62102462);广东省基础与应用基础研究基金(2022A1515010108);广东技术师范大学科研启动项目(2021SDKYA127)。
伴随着语音识别的发展,语音欺骗的方式也层出不穷.针对一些模仿或经过伪造、变形的语音,本文提出了一种改进的梅尔频率倒谱系数(MFCC)语音特征提取方式,不经过最后一步离散余弦变换,使用保留了更多特征的滤波器组,并经过倒谱均值和方差...
关键词:语音欺骗 MFCC 滤波器组 残差网络 
混合F-MFCC参数与多项集成ML算法的音乐情感分类方法研究
《现代科学仪器》2024年第6期369-374,共6页刘丹霞 李西萍 路惠捷 
2022年度国防军事教育科研项目军队重点课题“军队院校思政课程与课程思政协同育人问题研究”,项目编号:JYKY-C2022032。
针对目前音乐情感分类方法存在的特征提取不充分、准确率不高的问题,研究提出了一种改进梅尔频率倒谱系数,以更好提取地音乐情感特征,并结合多项集成机器算法来对音乐情感进行分类。结果表明,改进后的梅尔频率倒谱系数参数对愤怒、高兴...
关键词:F-MFCC ML 音乐情感分类 特征提取 多头注意力机制 
基于改进的MFCC与CNN心音信号识别方法的研究被引量:1
《计算机测量与控制》2024年第12期201-207,215,共8页王佳佳 熊飞龙 
江西省教育厅项目(GJJ21084)。
心音分类在心血管疾病的早期检测中起着至关重要的作用,特别是对小型初级卫生保健诊所、缺少专业人员陪护的家庭等检测;为提高心音信号数据类别间的可辨别性,提出了一种改进MFCC方法提取数据特征,并与PCA算法组合,作为样本输入CNN模型...
关键词:心音分类 MFCC 滤波 PCA CNN 
基于多媒体语音控制的旋耕机运动控制系统研究
《农机化研究》2024年第11期121-125,共5页王婷婷 
重庆市教育科学规划课题(HG2022K301)。
随着人工智能和多媒体技术的发展,旋耕机在农业生产中发挥着重要作用。为此,以旋耕机运动控制系统为核心,介绍了旋耕机的整体结构和控制原理,基于MFCC特征提取和VQ矢量方法设计了一种多媒体语音识别系统,实现对旋耕机耕深和运动的控制...
关键词:旋耕机 运动控制 多媒体 语音识别 MFCC VQ 
基于神经网络加速器的FPGA语音情感识别系统
《计算机应用与软件》2024年第10期163-169,246,共8页乔栋 陈章进 邓良 张廓 
国家自然科学基金项目(61674100)。
针对现有语音情感识别系统的部署功耗高、不具有便携性的缺点,提出一种基于神经网络加速器的FPGA语音情感识别系统设计。在FPGA上实现语音MFCC(Mel Frequency Cepstrum Coefficient)特征的提取,便于进行识别;为神经网络加速器设计指令...
关键词:MFCC 语音情感识别 神经网络加速器 FPGA 
基于音频去干扰自学习神经网络的地下线缆定位系统研究
《电气时代》2024年第9期93-98,共6页吴清涛 傅晓杰 张晨 白蕾 龚侃 刘亦颖 
城市地下线缆是城市电力、通信、网络和其他基础设施系统的核心组成部分,其管理和维护逐渐成为保证城市正常运行的关键。为便捷准确地对地下线缆的故障点进行定位,提出基于音频去干扰预处理算法和一种引入残差模块的深度神经网络的地下...
关键词:快速傅里叶变换 梅尔倒谱系数 音频信号 预加重 深度神经网络 音频数据 音频识别 MFCC 
基于LSTM模型的音乐推荐系统研究
《电声技术》2024年第9期136-138,共3页范凯燕 胡彦红 
随着音乐推荐技术的快速发展,如何提升音乐推荐系统的准确性和用户满意度成为研究的重点。研究一种结合梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)、长短期记忆(Long Short-Term Memory,LSTM)网络、内容推荐方法的音...
关键词:音乐推荐 梅尔频率倒谱系数(MFCC) 长短期记忆(LSTM) 内容推荐 
基于小波散射变换和MFCC的双特征语音情感识别融合算法被引量:2
《电信科学》2024年第5期62-72,共11页应娜 吴顺朋 杨萌 邹雨鉴 
浙江省自然科学基金资助项目(No.LTGS23F010001);浙江省属高校基本科研业务费专项资金资助项目(No.GK239909299001-406)。
为了充分挖掘语音信号频谱包含的情感信息以提高语音情感识别的准确性,提出了一种基于小波散射变换和梅尔频率倒谱系数(Mel-frequency cepstral coefficient,MFCC)的排列熵加权和偏差调整规则的语音情感识别融合算法(PEW-BAR)。算法首...
关键词:语音情感识别 小波散射变换 排列熵 MFCC 模型融合 
MFCC based real-time speech reproduction and recognition using distributed acoustic sensing technology被引量:2
《Optoelectronics Letters》2024年第4期222-227,共6页ZHOU Ran ZHAO Shuai LUO Mingming MENG Xin MA Jie LIU Jianfei 
supported by the National Natural Science Foundation of China(No.6210031560);the Natural Science Foundation of Hebei Province(No.A2020202013);the Natural Science Foundation of Tianjin City(No.21JCQNJC00780)。
The distributed acoustic sensing technology was used for real-time speech reproduction and recognition,in which the voiceprint can be extracted by the Mel frequency cepstral coefficient(MFCC)method.A classic ancient C...
关键词:MFCC PASSIVE COEFFICIENT 
Audiovisual speech recognition based on a deep convolutional neural network
《Data Science and Management》2024年第1期25-34,共10页Shashidhar Rudregowda Sudarshan Patilkulkarni Vinayakumar Ravi Gururaj H.L. Moez Krichen 
Audiovisual speech recognition is an emerging research topic.Lipreading is the recognition of what someone is saying using visual information,primarily lip movements.In this study,we created a custom dataset for India...
关键词:Audiovisual speech recognition Custom dataset 1D Convolution neural network(CNN) Deep CNN(DCNN) Long short-term memory(LSTM) LIPREADING Dlib Mel-frequency cepstral coefficient(MFCC) 
检索报告 对象比较 聚类工具 使用帮助 返回顶部