根据语音分形维和基音周期的说话人性别识别研究  被引量:1

Speaker Gender Identification Based on Audio Fractal Dimension and Pitch Feature

在线阅读下载全文

作  者:王振华[1] 杨翠容[1] 武薇[1] 范影乐[1] 

机构地区:[1]杭州电子科技大学生物医学工程与仪器研究所,杭州310018

出  处:《生物医学工程学杂志》2008年第4期805-810,共6页Journal of Biomedical Engineering

基  金:国家自然科学基金资助项目(60302027);浙江省教育厅科研计划项目资助(20030620)

摘  要:根据语音特征实现说话人性别的自动识别,在音频处理与分析中具有重要的应用意义。为了克服语音常规线性参数在刻画说话人性别特征上的不足,本文使用了分形维等非线性参数作为特征空间的有效补偿。首先利用提升算法实现基音周期的提取;然后提取语音的分形维数;最后根据Takens定理,对分形维进行了重构,采用求近似熵的方法得到分形维复杂度。将基音周期、分形维数以及分形维复杂度构成三维向量,进行说话人的性别识别。实验证明,通过非线性参数的介入,与仅使用基音周期等传统线性特征的识别方法相比,识别系统的准确率和稳定性得到有效提高,因此为说话人性别识别提供了一个新的思路。Automatic speaker gender identification based on voice feature is an important task in voice processing and analysis fields. In this paper non-linear parameters such as fractal dimension are applied to be one part of feature space for improving the ability of describing speaker gender feature through conventional linear parameters method. Pitch is picked using lifting scheme, and audio fractal dimension is extracted. Then based on Takens theory, the time delay method is used to reconstruct the phase space o...

关 键 词:性别识别 分形维数 分形维复杂度 基音周期 

分 类 号:TP391.42[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象