自动语音识别

作品数:105被引量:380H指数:10
导出分析报告
相关领域:自动化与计算机技术电子电信更多>>
相关作者:徐波浦剑涛张连海王建荣谢达东更多>>
相关机构:谷歌有限责任公司三星电子株式会社英特尔公司深圳市腾讯计算机系统有限公司更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划天津市自然科学基金湖北省自然科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于EfficientNetV2-RetNet的端到端中文管制语音识别
《电讯技术》2025年第2期254-260,共7页梁海军 常瀚文 何一民 赵志伟 孔建国 
国家重点研发计划(2021YFF0603904);中央高校基本科研业务费专项资金资助(PHD2023-035);中央高校基本科研业务费资助项目(24CAFUC10195)。
自动语音识别(Automatic Speech Recognition, ASR)技术在空中交通管制(Air Traffic Control, ATC)领域的应用有望提高通信效率、减少人为错误、提升安全性,并促进航空交通管理系统的创新和改进。然而,由于ATC通信通常涉及敏感信息,获...
关键词:空中交通管制 自动语音识别 端到端深度学习 迁移学习 
基于语音识别的机械臂控制系统设计被引量:1
《青岛大学学报(工程技术版)》2024年第4期44-51,共8页白梦飞 金衎哲 符朝兴 
山东省自然科学基金资助项目(ZR2020QE183)。
为了方便工作人员控制机械臂,设计了一种通过语音命令机械臂完成动作的控制系统。通过自动语音识别模块采集语音,对语音信号进行降噪处理,提高语音信号质量,利用语音识别模型对语音信号进行识别分析和关键词匹配,自动生成指导机械臂运...
关键词:自动语音识别 谱减法 关键词匹配 机械臂控制 
面向管制语音识别系统的性能评价方法
《科学技术与工程》2024年第33期14278-14286,共9页潘卫军 王梓璇 蒋培元 王壮 
国家重点研发计划(2021YFF0603904)。
目前,随着空中交通管理领域的发展,越来越多的人工智能技术运用到管制领域。其中自动语音识别技术被用于管制指令纠错、复诵一致性检验等方面,用于提升飞行安全和效率。为了解决自动语音识别系统的性能参差不齐的问题,提出了一种面向管...
关键词:自动语音识别 空中交通管制 性能评价 层次分析法 
基于递归神经网络的藏语语音转文本应用研究
《互联网周刊》2024年第17期23-25,共3页彭杨 徐健 卓嘎 付好 邢立佳 
国家级大学生创新创业训练计划项目——深度递归神经网络在藏语语音转文字中的应用研究(编号:202410694031)。
本文针对藏语中的卫藏方言,探讨了自动语音识别(automatic speech recognition,ASR)技术在语音识别模型构建方面的应用。利用时间递归神经网络(recurrent neural network,RNN)及其变体来提升ASR系统的性能。通过引入LAS(listen,attend a...
关键词:时间递归神经网络 自动语音识别 藏语语音 
有限词汇的自动语音识别算法研究被引量:1
《数据通信》2024年第4期50-54,共5页王绎翔 
自动语音识别(Automatic Speech Recognition,ASR)在语音输入法、自动语音应答、语音搜索等场景均具有广泛的应用。然而,大部分应用程序都是基于有丰富资源的语言,这使得资源不足的语言时常难以处理。设计以资源不足语言的ASR系统算法...
关键词:语音识别 深度学习 深度强化学习 机器学习 
一种基于Transformer模型的特征增强算法及其应用研究
《佛山科学技术学院学报(自然科学版)》2024年第3期27-34,共8页李俊华 段志奎 于昕梅 
广东省普通高校重点实验室资助项目(2021KSYS008)。
Transformer模型在自动语音识别(ASR)任务中展现出优秀的性能,但在特征提取方面存在两个问题:一是模型集中于全局特征交互信息提取,忽略了其他有用的特征信息,如局部特征交互信息;二是模型对低层特征交互信息的利用不够充分。为了解决...
关键词:Transformer模型 自动语音识别 特征增强 局部特征 特征融合 
基于词覆盖率的语音数据集最小化方法
《软件导刊》2024年第5期33-37,共5页朱治军 付磊 
为解决高性能自动语音识别模型训练集采集成本高和训练成本高的问题,提出一种基于词覆盖率的语音训练集最小化方法,尽可能减少训练集所需的数据规模。该方法引入向量空间模型的概念,将所有语料文本映射到高维空间,通过计算向量之间的余...
关键词:自动语音识别 向量空间模型 余弦距离 汉明重量 训练集最小化 
复杂真实环境下的调度电话转录算法研究
《铁道运输与经济》2024年第4期83-93,100,共12页詹丛茵 鲁工圆 高辉 钱立 陈历泉 
国家重点研发计划项目(2022YFB4300504);四川省自然科学基金项目(2022NSFSC0397);中国铁路广州局集团有限公司科技研究开发计划课题(KYL202301-0006)。
调度电话的应答是调度员日常工作的重要部分,也是事故回放审查的重要依据。为了提高事故分析及回放审查的效率,为调度指挥智能化打下基础,提出一种基于注意力机制及连接时序分类联合训练的调度电话转录算法,旨在提高复杂现实环境中调度...
关键词:铁路运输 调度电话转录 多任务训练 铁路调度指挥 半监督训练 自动语音识别 
自动语音识别模型压缩算法综述被引量:2
《吉林大学学报(理学版)》2024年第1期122-131,共10页时小虎 袁宇平 吕贵林 常志勇 邹元君 
国家自然科学基金(批准号:62272192);吉林省科技发展计划项目(批准号:20210201080GX);吉林省发改委项目(批准号:2021C044-1);吉林省教育厅科研基金(批准号:JJKH20200871KJ)。
随着深度学习技术的发展,自动语音识别任务模型的参数数量越来越庞大,使得模型的计算开销、存储需求和功耗花费逐渐增加,难以在资源受限设备上部署.因此对基于深度学习的自动语音识别模型进行压缩,在降低模型大小的同时尽量保持原有性...
关键词:语音识别 模型压缩 知识蒸馏 模型量化 低秩分解 网络剪枝 参数共享 
多声学场景下端到端语音识别声学编码器的自适应被引量:3
《声学学报》2023年第6期1260-1268,共9页刘育坤 郑霖 黎塔 张鹏远 
国家重点研发计划项目(2020AAA0108002);中国科学院声学研究所自主部署“目标导向”类项目(MBDX202106)资助。
提出了一种面向多样化声学场景自适应设计声学编码器的方法(SAE)。该方法通过学习不同声学场景下语音中包含的声学特征的差异,适应性地为端到端语音识别任务设计出合适的声学编码器。通过引入神经网络结构搜索技术,提高了编码器设计的...
关键词:自动语音识别 声学编码器 自适应 神经网络结构搜索 
检索报告 对象比较 聚类工具 使用帮助 返回顶部