检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:吴蔚澜 张卫强[3] 刘巍巍[3] 田垚[3] 陈振锋[1,2] 刘加[3] 夏善红[1]
机构地区:[1]中国科学院电子学研究所传感技术国家重点实验室,北京100190 [2]中国科学院大学,北京100190 [3]清华大学电子工程系清华信息科学与技术国家实验室(筹),北京100084
出 处:《中国科学院大学学报(中英文)》2014年第5期714-719,共6页Journal of University of Chinese Academy of Sciences
基 金:国家自然科学基金(61005019;61273268;90920302);北京市自然科学基金(KZ201110005005)资助
摘 要:在说话人识别中,有效语音数据的选择是一个重要的预处理环节.常用的数据选择方法根据能量信息的强弱对有效数据进行提取,但在实际情况中能量的高低与语音数据并无必然联系.本文在对传统方法进行分析比较的同时引入语言学知识,提出基于辅音信息的有效数据选择方法.该方法通过对活动语音检测结果中音素识别结果进行分析,保留所有元音,对辅音进行筛选,去除无益于说话人识别的干扰辅音音素,从而实现对有效语音数据的选取.实验表明,应用该方法得到的说话人识别结果,明显优于传统的基于能量的数据选择算法,如基于G.723.1标准的活动语音检测算法和近期提出的基于交叉熵顺序统计滤波的端点检测算法.In speaker recognition, the selection of useful information is an important pre-processing step. Usual ways for selection of the useful information are based on energy. However, between useful information and energy there are no necessary connections. After analying the traditional selection ways, we propose a phoneme decoder based data selection algorithm. Through analysis of the phoneme recognition results, all vowels are kept and some useless consonants are filtered. Thespeaker recognition experiment results show that the proposed method is superior to the traditional energy-based data selection algorithms such as G. 723.1 algorithm and the recently proposed cross entropy based order statistics filtering algorithm.
分 类 号:TN912.3[电子电信—通信与信息系统]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.166