检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]南京邮电大学通信与信息工程学院,南京210003 [2]南京邮电大学"宽带无线通信与传感网技术"教育部重点实验室,南京210003
出 处:《数据采集与处理》2015年第2期399-407,共9页Journal of Data Acquisition and Processing
基 金:国家自然科学基金(61271335)资助项目;江苏省普通高校研究生科研创新计划(CXZZ13-0488)资助项目
摘 要:本文为在传统的说话人识别理论研究中"较少的特征参数量不能与较高的识别率共存"的难题找到了一种解决方案。本文基于压缩感知的理论,利用行阶梯观测矩阵进行信号的投影,改变了传统的梅尔频率倒谱系数(Mel-frequency cepstral coefficient,MFCC)参数,从而提出了一种新的识别参数CSMFCC(Compressed sensing-MFCC)。该参数不仅使得参数存储量降低到少于原存储量的1/n(n为行阶梯观测矩阵的压缩比),而且明显提高了系统的鲁棒性。通过仿真实验证明了当压缩比n为4时,平均识别率能够提高到96%以上。A solution is proposed to deal with the problem that″less number of features cannot coexist with higher recognition rate″in the traditional theory of speaker recognition.Ladder observation matrix projection is used to change the traditional Mel-frequency cepstral coefficient(MFCC)parameters based on compressed sensing theory,presenting a new recognition parameters named compressed sensing MFCC(CS-MFCC)parameters.These parameters make storage capacity decrease to less than 1/nof the original,here nis the compression ratio of the line ladder matrix,and also greatly increase the robustness of the system.Furthermore simulation results prove that when nis 4,the recognition rate increases to96% above.
关 键 词:说话人识别 压缩感知 识别率 CS-MFCC 鲁棒性
分 类 号:TN912.3[电子电信—通信与信息系统]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.191.239.206