国家自然科学基金(61271389)

作品数:4被引量:20H指数:2
导出分析报告
相关作者:郑方王东艾斯卡尔·肉孜张陈昊张之勇更多>>
相关机构:清华大学新疆大学中国建设银行奥克兰大学更多>>
相关期刊:《清华大学学报(自然科学版)》更多>>
相关主题:语音识别说话人识别DNN免费维吾尔语更多>>
相关领域:自动化与计算机技术电子电信更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-4
视图:
排序:
说话人识别中的分数域语速归一化被引量:4
《清华大学学报(自然科学版)》2018年第4期337-341,共5页艾斯卡尔·肉孜 王东 李蓝天 郑方 张晓东 金磐石 
国家自然科学基金资助项目(61271389,61371136);国家“九七三”重点基础研究发展计划(2013CB329302)
语速变化导致说话人识别系统性能显著下降。该文提出一种分数域语速归一化方法来降低语速变化对说话人识别系统的影响。由不同语速语音数据组成参考集(全局和局部),对每一个登入说话人估计其对参考集中每一类参考语音的分数分布,局部...
关键词:说话人识别 分数域 语速归一化 相对语速 GMM-UBM 
THUYG-20:免费的维吾尔语语音数据库被引量:13
《清华大学学报(自然科学版)》2017年第2期182-187,共6页艾斯卡尔·肉孜 殷实 张之勇 王东 艾斯卡尔·艾木都拉 郑方 
国家自然科学基金项目(61271389,61371136);国家“九七三”重点基础研究发展计划(2013CB329302)
语音数据资源是语音识别研究的基础。当前国内只有为数不多的开放的语音数据库供研究者免费使用,特别是在维吾尔语等少数民族语音识别方面,数据资源更为贫乏。该文发布一个完全免费的维吾尔语连续语音数据库,该数据库包括约20h的训练数...
关键词:语音识别 维吾尔语 语料库 深度神经网络(DNN) 
基于PLAR的说话人确认系统的噪音鲁棒性被引量:2
《清华大学学报(自然科学版)》2013年第6期791-795,共5页尹聪 白静 龚宬 张陈昊 郑方 Waleed H.Abdulla 
国家自然科学基金项目(61271389);国家"九七三"重点基础研究发展计划(2013CB329302)
针对Mel频率倒谱系数(Mel frequency cepstralcoefficient,MFCC)特征的说话人确认系统在干净语音环境下具有很高识别率但在噪音环境下识别率急剧下降的缺点,构建了基于感知对数面积比系数(perceptual log area ratio,PLAR)特征的说话人...
关键词:说话人确认 感知对数面积比系数(PLAR) 鲁棒性 融合 
基于多音素类模型的文本无关短语音说话人识别被引量:1
《清华大学学报(自然科学版)》2013年第6期813-817,共5页张陈昊 郑方 王琳琳 
国家自然科学基金项目(61271389);国家"九七三"重点基础研究发展计划(2013CB329302)
对于基于Gauss混合模型-通用背景模型(Gaussianmixure model-universal background model,GMM-UBM)方法的文本无关说话人识别,当测试语音时长缩短到很短时,识别率会严重下降。为了充分利用文本内容信息,该文提出了一种基于K-top多音素...
关键词:短语音说话人识别 语音识别 音素类多模型 
检索报告 对象比较 聚类工具 使用帮助 返回顶部