说话人识别中基于音素分类的数据选择方法  

Data selection method in speaker recognition based on classification of phonemes

在线阅读下载全文

作  者:吴蔚澜 张卫强[3] 刘巍巍[3] 田垚[3] 陈振锋[1,2] 刘加[3] 夏善红[1] 

机构地区:[1]中国科学院电子学研究所传感技术国家重点实验室,北京100190 [2]中国科学院大学,北京100190 [3]清华大学电子工程系清华信息科学与技术国家实验室(筹),北京100084

出  处:《中国科学院大学学报(中英文)》2014年第5期714-719,共6页Journal of University of Chinese Academy of Sciences

基  金:国家自然科学基金(61005019;61273268;90920302);北京市自然科学基金(KZ201110005005)资助

摘  要:在说话人识别中,有效语音数据的选择是一个重要的预处理环节.常用的数据选择方法根据能量信息的强弱对有效数据进行提取,但在实际情况中能量的高低与语音数据并无必然联系.本文在对传统方法进行分析比较的同时引入语言学知识,提出基于辅音信息的有效数据选择方法.该方法通过对活动语音检测结果中音素识别结果进行分析,保留所有元音,对辅音进行筛选,去除无益于说话人识别的干扰辅音音素,从而实现对有效语音数据的选取.实验表明,应用该方法得到的说话人识别结果,明显优于传统的基于能量的数据选择算法,如基于G.723.1标准的活动语音检测算法和近期提出的基于交叉熵顺序统计滤波的端点检测算法.In speaker recognition, the selection of useful information is an important pre-processing step. Usual ways for selection of the useful information are based on energy. However, between useful information and energy there are no necessary connections. After analying the traditional selection ways, we propose a phoneme decoder based data selection algorithm. Through analysis of the phoneme recognition results, all vowels are kept and some useless consonants are filtered. Thespeaker recognition experiment results show that the proposed method is superior to the traditional energy-based data selection algorithms such as G. 723.1 algorithm and the recently proposed cross entropy based order statistics filtering algorithm.

关 键 词:说话人识别 有效数据 音素解码器 辅音 

分 类 号:TN912.3[电子电信—通信与信息系统]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象