检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《自动化学报》2016年第6期959-964,共6页Acta Automatica Sinica
基 金:国家自然科学基金(61365006;61263037)资助~~
摘 要:在语音信号中,基音是一个重要参数,且有重要用途.然而,检测噪声环境中语音的基音却是一项难度较大的工作.由于卷积神经网络(Convolutional neural network,CNN)具有平移不变性,能够很好地刻画语谱图中的谐波结构,因此我们提出使用CNN来完成这项工作.具体地,我们使用CNN来选取候选基音,再用动态规划方法 (Dynamic programming,DP)进行基音追踪,生成连续的基音轮廓.实验表明,与其他方法相比,本文的方法具有明显的性能优势,并且对新的说话人和噪声有很好的泛化性能,具有更好的鲁棒性.Pitch is an important characteristic of speech and is useful for many applications. However, pitch determination in noisy conditions is difficult. Because shift-invariant property of convolutional neural network(CNN) is suitable to model spectral feature for pitch detection, we propose a supervised learning algorithm to estimate pitch using CNN. Specifically,we use CNN for pitch candidate selection, and dynamic programming(DP) for pitch tracking. Our experimental results show that the proposed method can obtain accurate pitch estimation and that it has a good generalization ability in terms of new speakers and noisy conditions.
分 类 号:TN912.3[电子电信—通信与信息系统] TP183[电子电信—信息与通信工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3