说话人自适应

作品数:55被引量:217H指数:8
导出分析报告
相关领域:电子电信自动化与计算机技术更多>>
相关作者:杨鉴尉洪张文林王作英普园媛更多>>
相关机构:清华大学上海交通大学解放军信息工程大学云南大学更多>>
相关期刊:《计算机工程与应用》《电子学报》《北京邮电大学学报》《计算机与信息技术》更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划内蒙古自治区自然科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
构音障碍说话人自适应研究进展及展望
《计算机科学》2024年第8期11-19,共9页康新晨 董雪燕 姚登峰 钟经华 
北京市自然科学基金(4202028);国家语言文字工作委员会项目(YB145-25);国家自然科学基金(62036001);国家社会科学基金(21BYY106,21&ZD292);2019年度北京市教育委员会科技一般项目(KM201911417005)。
自动化语音识别工具让构音障碍者和正常人的沟通变得顺畅,因此,近年来构音障碍语音识别成为了一项热门研究。构音障碍语音识别的研究包括:收集构音障碍者和正常人的发音数据,对构音障碍者和正常人的语音进行声学特征表示,利用机器学习...
关键词:构音障碍 说话人自适应 辅助特征 变换 微调 域自适应 
基于Ⅰ-Vector特征融合的蒙古语说话人特征提取方法
《中文信息学报》2023年第1期71-78,共8页韩佳俊 马志强 王洪彬 谢秀兰 
国家自然科学基金(61762070,61862048);内蒙古自治区自然科学基金(2019MS06004);内蒙古自治区科技重大专项(2019ZD015);内蒙古自治区关键技术攻关计划项目(2019GG273)。
针对蒙古语语料少导致蒙古语说话人自适应语音识别系统效果差的问题,该文提出一种基于Ⅰ-vector特征融合的说话人特征提取方法。首先在低资源语料和高资源语料上分别训练Ⅰ-vector模型,之后利用两者训练得到的Ⅰ-vector特征作为中间数...
关键词:Ⅰ-vector 说话人自适应 特征提取 蒙古语 低资源 
小数据下的音素级别说话人嵌入的语音合成自适应方法被引量:10
《计算机学报》2022年第5期1003-1017,共15页徐志航 陈博 张辉 俞凯 
在语音合成中,使用少量的用户录制数据进行说话人自适应一直面临着一个问题:如何在不过分降低合成声音的自然度的情况下,提高合成声音的相似度.现有的句子级别、帧级别说话人嵌入等自适应方法在合成训练集外说话人声音时会出现低相似度...
关键词:语音合成 说话人嵌入 时长模型 小数据 说话人自适应 
语音识别中说话人自适应方法研究综述被引量:9
《计算机科学与探索》2021年第12期2241-2255,共15页朱方圆 马志强 陈艳 张晓旭 王洪彬 宝财吉拉呼 
国家自然科学基金(61762070,61862048);内蒙古自治区自然科学基金(2019MS06004);内蒙古自治区科技重大专项(2019ZD015);内蒙古自治区关键技术攻关计划项目(2019GG273);内蒙古自治区科技成果转化专项资金(2020CG0073)。
语音是人机交互方式之一,语音识别技术是人工智能的重要组成部分。近年来神经网络技术在语音识别领域的应用快速发展,已经成为语音识别领域中主流的声学建模技术。然而测试条件中目标说话人语音与训练数据存在差异,导致模型不适配的问...
关键词:语音识别 说话人自适应(SA) 神经网络 
I-vector聚类字典及注意力机制框架的说话人自适应被引量:5
《小型微型计算机系统》2019年第2期460-464,共5页黄俊 蒋兵 李先刚 郭武生 戴礼荣 
国家重点研发计划项目(2017YFB1002200)资助
近些年来,语音识别任务中的说话人自适应技术在实际工程中得到广泛应用.基于i-vector的说话人自适应是其中最为重要的一种,但是提取i-vector需要用到整句话的信息,并不能用于线上的自适应.因此,本文设计了一种基于i-vector聚类字典及注...
关键词:i-vector字典 注意力机制 说话人自适应 语音识别 
基于多情感说话人自适应的情感语音合成研究被引量:1
《湘潭大学学报(自然科学版)》2018年第4期39-44,共6页李葵 徐海青 吴立刚 梁翀 
国网总部科技项目(5268001600SV)
提出了一种基于多情感自适应的情感语音合成方法,其创新点在于,通过SAT过程从多个说话人的情感语音语料中获得情感语音的平均音模型,对目标说话人的情感数据进行自适应变换,构建目标情感的声学参数模型,从而达到合成出目标说话人的情感...
关键词:情感语音合成 情感语料库 SAT 统计参数语音合成 
基于深度神经网络的说话人自适应方法研究被引量:1
《信息技术与网络安全》2018年第4期60-64,共5页古典 李辉 
在说话人自适应领域,基于深度神经网络(DNN)的说话人自适应方法已成为主流方法。学习性隐层单元贡献(LHUC)作为一种有效的无监督自适应方法比其他自适应方法有诸多优势,而自适应数据的稀疏问题却导致识别性能受到影响。为了降低数据稀...
关键词:说话人自适应 LHUC i-vector 多任务学习 
语音识别中神经网络声学模型的说话人自适应研究被引量:12
《计算机应用与软件》2018年第2期200-205,266,共7页金超 龚铖 李辉 
针对语音识别系统中测试的目标说话人语音和训练数据的说话人语音存在较大差异时,系统识别准确率下降的问题,提出一种基于深度神经网络DNN(Deep Neural Network)的说话人自适应SA(Speaker Adaptation)方法。它是在特征空间上进行的说话...
关键词:深度神经网络 说话人 自适应声学模型 ivector向量 
干扰空间投影在本征音说话人自适应中的应用
《计算机应用与软件》2017年第11期188-191,263,共5页刘建航 杨喜鹏 李世宝 陈海华 黄庭培 
国家自然科学基金青年基金项目(61601519;61402433);山东省自然科学基金项目(ZR2014FM017);青岛市科技创新计划项目(15-9-80-jch)
本征音自适应是一种快速高效的自适应算法,它被广泛应用到说话人识别中,但由于同一个说话人的本征音自适应的说话人因子之间的信道特征和噪声存在差异,导致了算法的识别精度降低。针对这一问题,提出基于干扰空间投影的本征音说话人识别(...
关键词:本征音自适应 干扰空间投影 主成分分析 信道失配 
深度神经网络自适应中基于身份认证向量的归一化方法被引量:6
《中国科学院大学学报(中英文)》2017年第5期633-639,共7页杨建斌 张卫强 刘加 
国家自然科学基金(61370034;61403224)资助
深度神经网络是近年来非常流行的一种语音识别声学建模技术,其性能比之前主流的高斯混合模型有显著提高,但是深度神经网络的说话人自适应技术一直没有很好地解决。利用身份认证向量对深度神经网络进行自适应,并研究身份认证向量归一化...
关键词:身份认证向量 深度神经网络 说话人自适应 归一化 
检索报告 对象比较 聚类工具 使用帮助 返回顶部