一种基于压缩感知的说话人识别参数分析被引量：2

Parameter of Speaker Recognition Based on Compressed Sensing

机构地区：[1]南京邮电大学通信与信息工程学院,南京210003 [2]南京邮电大学"宽带无线通信与传感网技术"教育部重点实验室,南京210003

出　　处：《数据采集与处理》2015年第2期399-407,共9页Journal of Data Acquisition and Processing

基　　金：国家自然科学基金(61271335)资助项目;江苏省普通高校研究生科研创新计划(CXZZ13-0488)资助项目

摘　　要：本文为在传统的说话人识别理论研究中"较少的特征参数量不能与较高的识别率共存"的难题找到了一种解决方案。本文基于压缩感知的理论,利用行阶梯观测矩阵进行信号的投影,改变了传统的梅尔频率倒谱系数(Mel-frequency cepstral coefficient,MFCC)参数,从而提出了一种新的识别参数CSMFCC(Compressed sensing-MFCC)。该参数不仅使得参数存储量降低到少于原存储量的1/n(n为行阶梯观测矩阵的压缩比),而且明显提高了系统的鲁棒性。通过仿真实验证明了当压缩比n为4时,平均识别率能够提高到96%以上。A solution is proposed to deal with the problem that″less number of features cannot coexist with higher recognition rate″in the traditional theory of speaker recognition.Ladder observation matrix projection is used to change the traditional Mel-frequency cepstral coefficient（MFCC）parameters based on compressed sensing theory,presenting a new recognition parameters named compressed sensing MFCC（CS-MFCC）parameters.These parameters make storage capacity decrease to less than 1/nof the original,here nis the compression ratio of the line ladder matrix,and also greatly increase the robustness of the system.Furthermore simulation results prove that when nis 4,the recognition rate increases to96% above.

关键词：说话人识别压缩感知识别率 CS-MFCC 鲁棒性

分类号：TN912.3[电子电信—通信与信息系统]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

一种基于压缩感知的说话人识别参数分析被引量：2

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

一种基于压缩感知的说话人识别参数分析 被引量：2

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

一种基于压缩感知的说话人识别参数分析被引量：2