基于卷积神经网络的鲁棒性基音检测方法  被引量:4

Convolutional Neural Network for Robust Pitch Determination

在线阅读下载全文

作  者:张晖[1] 苏红[1] 张学良[1] 高光来[1] 

机构地区:[1]内蒙古大学计算机学院,呼和浩特010020

出  处:《自动化学报》2016年第6期959-964,共6页Acta Automatica Sinica

基  金:国家自然科学基金(61365006;61263037)资助~~

摘  要:在语音信号中,基音是一个重要参数,且有重要用途.然而,检测噪声环境中语音的基音却是一项难度较大的工作.由于卷积神经网络(Convolutional neural network,CNN)具有平移不变性,能够很好地刻画语谱图中的谐波结构,因此我们提出使用CNN来完成这项工作.具体地,我们使用CNN来选取候选基音,再用动态规划方法 (Dynamic programming,DP)进行基音追踪,生成连续的基音轮廓.实验表明,与其他方法相比,本文的方法具有明显的性能优势,并且对新的说话人和噪声有很好的泛化性能,具有更好的鲁棒性.Pitch is an important characteristic of speech and is useful for many applications. However, pitch determination in noisy conditions is difficult. Because shift-invariant property of convolutional neural network(CNN) is suitable to model spectral feature for pitch detection, we propose a supervised learning algorithm to estimate pitch using CNN. Specifically,we use CNN for pitch candidate selection, and dynamic programming(DP) for pitch tracking. Our experimental results show that the proposed method can obtain accurate pitch estimation and that it has a good generalization ability in terms of new speakers and noisy conditions.

关 键 词:信号处理 基音检测 卷积神经网络 动态规划 

分 类 号:TN912.3[电子电信—通信与信息系统] TP183[电子电信—信息与通信工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象