声学模型

作品数:322被引量:1079H指数:14
导出分析报告
相关领域:自动化与计算机技术电子电信更多>>
相关作者:颜永红张鹏远吕勇徐波王仁华更多>>
相关机构:中国科学院百度在线网络技术(北京)有限公司清华大学平安科技(深圳)有限公司更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划北京市自然科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
藏语语声识别声学模型建模单元研究
《应用声学》2025年第2期405-412,共8页王嘉文 高定国 索朗曲珍 
国家自然科学基金项目(62166038);四川省科技计划项目(2023YFQ0044);西藏大学研究生“高水平人才培养计划”项目(2021-GSP-S126)。
语声识别建模单元的选择是藏语语声识别任务中的关键问题,决定了语声识别声学模型的训练质量和识别准确性。针对藏语语声识别研究中多种建模单元在不同数据集上进行的实验,导致难以探寻合适建模单元进行藏语语声识别,使得相关科研成果...
关键词:藏语 语声识别 声学模型 建模单元 
基于改进MFCC特征提取和DNN网络的机器人语音识别方法研究
《计算机测量与控制》2025年第2期246-253,共8页秦垲忻 王炜昕 王砚生 
2022年云南省哲学社会科学规划项目(YB2022085);2024年全国教育规划青年课题(EHA210438)。
为了实现机器人语音控制,并避免环境噪音的干扰,研究提出了基于改进MFCC特征提取和深度神经网络的机器人语音控制指令识别方法;该方法利用线性判别分析、最大似然线性变换和说话人自适应变换对MFCC特征进行处理,获得了新的语音特征;同...
关键词:语音识别 语音增强 声学模型 MFCC特征 DNN 
基于DCNN-CTC的中文儿童语音识别研究
《自动化应用》2024年第23期28-30,共3页董胡 夏明霞 李垣陵 
教育部人文社会科学研究青年基金项目资助“基于深度学习的中文儿童语音识别声学模型及其语音能力评估研究”(22YJCZH025);长沙市社科联哲学社会科学规划课题研究成果(2024CSSKKT153)。
针对卷积神经网络(CNN)语音信号建模能力不足的问题,提出了一种基于深度卷积神经网络和连接时序分类器(DCNN-CTC)的中文童声识别模型。此模型以CTC作为目标损失函数,通过在卷积神经网络的层之间引入残差跳跃连接,将前一层的输出直接传...
关键词:卷积神经网络 连接时序分类器 残差跳跃 声学模型 
特定频段高频噪声长期职业暴露对内耳听觉功能的影响:基于骨传导测听与物理声学模型分析
《中国医学物理学杂志》2024年第11期1404-1410,共7页陆天豪 何建乔 汪安昭 周义德 
国家自然科学基金(81670927);海军军医大学第一附属医院234学科攀登计划(2020YXK037)。
目的:探讨长期职业暴露于特定频段的高频噪声对内耳听觉功能的影响,基于骨传导测听与物理声学模型,评估高频噪声暴露对听觉阈值的损伤机制。方法:研究对象包括长期在高噪声环境中工作的工厂工人和机场地勤等职业人员,设立暴露组和对照...
关键词:职业暴露 高频噪声 内耳 听觉功能 骨传导测听 物理声学模型 
协调语音能量区域的正则化优化算法
《计算机工程与设计》2024年第7期2173-2179,共7页师晨康 薛珮芸 白静 赵建星 
山西省应用基础研究计划基金项目(201901D111094);山西省基础研究基金项目(青年)(20210302124544);山西省留学回国人员科技活动择优基金项目(20200017)。
为有效解决语音识别模型过拟合问题,提出一种协调语音能量区域的正则化优化算法。根据语音的共振峰特性,对语音信号高能量区域进行集体失活处理,增加模型对语音信号低能量区域的关注度;为进一步提升声学模型性能,采用堆叠8层的门控卷积...
关键词:语音识别 声学模型 语音能量区域 正则化 卷积神经网络 联结时序分类 深度学习 
低资源非自回归壮语语音合成
《中央民族大学学报(自然科学版)》2024年第2期40-47,共8页王杰 秦董洪 
广西科技基地和人才专项(桂科AD23026054);广西民族大学横向科研项目(2022450016000429)。
基于FastSpeech2模型,文章提出了非自回归的壮语语音合成模型Zhuang-TTS。为了提升模型合成壮语语音的韵律,根据壮语特点及实地调查提出了一套新的壮语音系(声调、声母或辅音、韵母或元音),同时针对壮语声学特点进行了改进:(1)使用壮语...
关键词:壮语语音合成 非自回归声学模型 非自回归声码器 CONFORMER 
基于生成对抗网络数据增强的抗噪语音识别系统
《上海大学学报(自然科学版)》2024年第3期476-490,共15页冯天宇 朱永华 
语音识别的研究始终存在数据集具有局限性的问题.通过数据增强可以提升训练数据的规模以及多样性,从而提升识别的准确率.提出了一种基于生成对抗网络(generative adversarial network,GAN)的语音数据生成方法,以改善噪声条件下的语音识...
关键词:生成对抗网络 声学模型 数据增强 噪声 语音识别 
基于深度神经网络的藏语语音关键词检索方法
《西藏科技》2024年第6期73-80,共8页张恒 拉巴顿珠 官政先 肖鑫 
2022年西藏大学大学生创新性实验训练计划项目(2022XCX085)。
语音关键词识别作为人机语音交互的一项基础性研究课题,其目的是从连续的语音信号中提取特定的关键词,并实现对目标设备的唤醒以及其他相关功能。文章提出了一种基于DNN-HMM声学模型的藏语卫藏方言关键词检测方法。首先,通过切割、转换...
关键词:声学模型 藏语 深度学习 关键词检测 语音识别 
面向政务系统的大数据语音识别系统应用及研究被引量:1
《现代科学仪器》2024年第1期155-160,共6页夏美艺 范灵 牛青松 桂鹂娟 
青海省2021年重点研发与转化计划项目《政务智能语音识别系统研究与应用》,项目编号:2021-GX-116。
当前对于大数据语音识别系统在政务系统应用中存在诸多缺陷,因此,研究将LSTM与CTC进行融合得到了LSTM-CTC声学模型,并进一步优化得到BiLSTM-CTC声学模型,同时验证其有效性。实验结果表明,在训练轮数为8时BiLSTM-CTC模型的WER值为60.38%...
关键词:政务系统 大数据 语音识别系统 声学模型 
当量和爆高(埋深)反演的声震分析方法被引量:1
《现代应用物理》2023年第4期190-204,共15页张亮永 张德志 肖卫国 梁旭斌 王同东 郭权势 李翱 
强脉冲辐射环境模拟与效应全国重点实验室基金资助项目(13062001)。
从声学模型、地震波模型和数据融合算法等3个方面系统介绍了当量和爆高(埋深)反演的声震分析方法最新成果:声学模型方面,介绍了半经验声学模型和全波形反演方法的进展,对已有声学模型进行了总结归纳,对比分析了各种模型的特点;地震波模...
关键词:近地面爆源 声震分析 声学模型 地震波模型 数据融合算法 贝叶斯MCMC 机器学习 
检索报告 对象比较 聚类工具 使用帮助 返回顶部