检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]哈尔滨工业大学计算机科学与技术学院,哈尔滨150001
出 处:《计算机工程与应用》2011年第3期135-138,共4页Computer Engineering and Applications
基 金:国家重点基础研究发展规划(973)No.2007CB311100~~
摘 要:编码环境失配是影响说话人识别准确率的重要因素之一。在说话人识别系统上,对码速率在5.15~128 Kb/s之间的语音编码进行了实验分析,结果表明,高速率语音编码对说话人识别系统的影响不大,低速率语音编码使系统性能急剧下降。针对这一问题,采用基于UBM的说话人模型合成算法对低速率语音编码的说话人模型进行补偿,在NIST 2002单说话人识别数据库上的实验表明,此方法能显著提高系统识别率。Environment mismatch in enrollment and test sessions caused by different code strategies is one of main reasons degrading the performance of speaker recognition.Experiments with speech in different code formats and code rate raging from 5.15 Kb/s to 128 Kb/s show that the speech with high-bit rate causes little distortion,while the ones with low-bit rate make the recognition rate decreasing sharply.To solve this problem,speaker model synthesis based on UBM is adopted to synthesis speaker models for target code environments to compensate the distortion caused by low-bit rate.Experiments on NIST 2002 corpus in one-speaker detection task show that the proposed approach obtains better performance than those with no compensation.
分 类 号:TN912.3[电子电信—通信与信息系统]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.90