非目标说话人GMM与BP神经网络声纹研究  

在线阅读下载全文

作  者:陈洪极 黄舒坦 曹越 苏成悦 陈静[1,2] 郑荣森 CHEN Hongji;HUANG Shutan;CAO Yue;SU Chengyue;CHEN Jing;ZHENG Rongsen

机构地区:[1]广东工业大学信息工程学院,广东广州510006 [2]广东工业大学物理与光电工程学院,广东广州510006

出  处:《信息技术与信息化》2021年第6期28-30,共3页Information Technology and Informatization

基  金:广东省科技计划项目(2017A020208063);广州市科技计划项目(201804010384);中山市重大科技专项项目(2016A1003)。

摘  要:声纹识别技术在生物特征识别领域区别于指纹、脸、虹膜等,其易获取、成本低等优势使其研究应用愈加广泛。研究了基于一种混合高斯模型的方法达到提高声纹识别率的效果。该方法充分利用非目标用户的混合高斯模型,其概率对数输出与BP神经网络结合,实现对混合高斯模型的补充作用,提高声纹识别率。该模型以多个预先训练的非目标用户的混合高斯为起点,接收来自目标用户的语音数据,产生的输出作用下一级神经网络的输入,进一步对数据进行训练。经实验结果表明,目标用户GMM模型的识别准确率为88.73%,而GMM-BP模型的识别准确率达到93.45%。

关 键 词:声纹识别 GMM BP神经网络 非目标用户 

分 类 号:TN912.3[电子电信—通信与信息系统] TP183[电子电信—信息与通信工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象