检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:白亮[1] 老松杨[1] 陈剑赟[1] 吴玲达[1]
机构地区:[1]国防科技大学多媒体研发中心,湖南长沙410073
出 处:《小型微型计算机系统》2005年第11期2029-2034,共6页Journal of Chinese Computer Systems
基 金:教育部新世纪优秀人才支撑项目
摘 要:音频特征分析和抽取是音频自动分类的基础,本文将音频对象分为静音,噪音,纯语音,带背景音语音,音乐等5类,从帧层次和段层次上深入分析了不同类音频之间的区别性特征,包括帧层次上的MFCC,频域能量,子带能量,过零率,频谱中心等特征,在此基础上计算了段层次上的基本音频特征,包括静音比率,子带能量比均值等,提出了3个音频"流"特征—High-ZCR比率,Low-Frequency-Energy比率,频谱流量.设计并实现了一种基于支持向量机(support vector machine)的自动分类器,考察了上述特征组成的特征集合在该分类器中的分类性能.实验表明,本文提出的特征有效,分类性能良好.Feature analysis and extraction are the foundation of audio automatic classification, this paper divides audio into four classes: silence, noise, pure speech ,speech with background and music. Audio features are analysed deeply in frame level and clip level, including MFCC, frequency energy, sub-band energy, ZCR, frequency centroid,etc, in frame level and silence ratio, mean of sub-band energy ratio ,etc, in clip level. Three audio flux features--High-ZCR ratio, Low-frequency-energy ratio, spectrum flux are proposed. Their performances are evaluated in a SVM-based audio classifier that is realized in this paper. The experiment results show that the features selected are effective for audio classification, and the classification accuracy is good.
分 类 号:TP316[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222