检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]合肥学院电子信息与电气工程系,合肥230022 [2]中国科学技术大学电子工程与信息科学系,合肥230027
出 处:《计算机工程与应用》2011年第26期140-142,共3页Computer Engineering and Applications
基 金:国家自然科学基金No.60970161;中央高校基本科研业务费专项资金项目;安徽省高校优秀青年人才基金~~
摘 要:音素层特征等高层信息的参数由于完全不受信道的影响,被认为可对基于声学参数的低层信息系统进行有益的补充,但高层信息存在数据稀少的缺点。建立了基于音素特征超矢量的识别方法,并采用BUT的音素层语音识别器对其识别性能进行分析,进而尝试通过数据裁剪和KPCA映射的方法来提升该识别方法的性能。结果表明,采用裁剪并不能有效提升其识别性能,但融合KPCA映射的识别算法的性能得到了显著提升。进一步与主流的GMM-UBM系统融合后,相对于GMM-UBM系统,EER从8.4%降至6.7%。As being hard to be influenced by the channel situation,the higher level information,such as phoneme feature,is recognized to be a good complementarity to the current speaker recognition technology based on lower level information,such as acoustic information.However,the higher level speech information has their inherent limitations of data sparsity.Based on the BUT speaker recognizer platform,the performance of the speaker recognition method based on phoneme feature super vector is analyzed and evaluated.The method of data pruning and Kernel Principal Component Analysis(KPCA) are introduced to improve its recognition performance.Results show that the recognition performance is not effectively improved by the data pruning method,but is greatly enhanced when the KPCA is used.Furthermore,when the current system is integrated with GMM-UBM(Gaussian Mixture Model-Universal Background Model) system,the EER(Equal Error Rate) of the GMM-UBM system can be lowered down from 8.4% to 6.7%.
关 键 词:音素层特征 说话人识别 核函数主元分析 数据裁剪
分 类 号:TN912.34[电子电信—通信与信息系统]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.219.203.214