基于二阶差分MFCC深度学习的声景基调声分类方法被引量：2

A soundscape keynote classification based on the second order difference MFCC in depth learning

作　　者：邓志勇[1] 张万亿刘爱利[3] DENG Zhiyong;ZHANG Wanyi;LIU Aili(Music College of Capital Normal University,Beijing 100048,China;Department of Music AI and Information Technology,Central Conservatory of Music,Beijing 100031,China;College of Resource Environment and Tourism,Capital Normal University,Beijing 100048,China)

机构地区：[1]首都师范大学音乐学院,北京100048 [2]中央音乐学院音乐人工智能与音乐信息科技系,北京100031 [3]首都师范大学资源环境与旅游学院,北京100048

出　　处：《中国传媒大学学报（自然科学版）》2023年第5期26-35,54,共11页Journal of Communication University of China：Science and Technology

基　　金：北京社科基金重点项目(22GLA014);国家自然科学基金面上项目(41871130)。

摘　　要：本文提出了一种可用于卷积神经网络分类技术的二阶差分MFCC特征,尝试解决声景学中基调声与非基调声二分类这一具有“人文色彩”的主观分类任务。以老北京中轴线的声景样本数据集为例,根据本文设计的网络模型结构,使用该二阶差分MFCC特征训练的二分类器对于声景基调声的识别准确率达到80.23%,远优于单独使用RMS和Mel频谱特征,以及联合使用RMS与二阶差分MFCC特征的准确率。In order to solve the subjective classification task of soundscape keynote classification with“humanistic color”in depth learning,a feature of the second order difference MFCC used in the classification technology of convolution neural network was put forward in this paper.Taking the soundscape data set in the axis of the Old Beijing for example,the accuracy of the keynote recognition by means of the second order difference MFCC in the designed CNN framework is 80.23%,which is higher than those of RMS,Mel spectrogram,and integration features of RMS and the second order difference MFCC.

关键词：声景基调声卷积神经网络二阶差分MFCC

分类号：O422[理学—声学]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于二阶差分MFCC深度学习的声景基调声分类方法被引量：2

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于二阶差分MFCC深度学习的声景基调声分类方法 被引量：2

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于二阶差分MFCC深度学习的声景基调声分类方法被引量：2