语音识别方法

作品数:89被引量:283H指数:8
导出分析报告
相关领域:自动化与计算机技术电子电信更多>>
相关作者:林毅韩纪庆徐波张鹏远韦岗更多>>
相关机构:科大讯飞股份有限公司深圳市腾讯计算机系统有限公司平安科技(深圳)有限公司阿里巴巴集团控股有限公司更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划广东省自然科学基金河南省自然科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
面向铁路领域的多方言免切换语音识别方法
《中国铁路》2025年第1期30-39,共10页杨立鹏 胡从刚 陈华龙 韩可可 刘峰 张志科 
中国铁道科学研究院集团有限公司科研开发基金项目(2023YJ132)。
随着铁路智能客服系统的持续发展,现有语音识别模型的准确率已达到较高水平,但面对铁路领域术语和多样化方言场景,其语音识别效果仍然较差,因此提出1种融合铁路领域知识的多方言免切换语音识别方法。基于RepVGG网络模型构建方言语种识别...
关键词:铁路领域语言模型 多方言 语音识别 RepVGG TRANSFORMER LSTM 
基于注意力机制深度学习的电力通信网络电话语音识别方法
《科技创新与生产力》2025年第1期104-106,110,共4页朱玉 李枫 
由于复杂的传输环境和噪声干扰,导致电力通信网络电话语音词错率较高。文章研究内容设计一种基于注意力机制深度学习的电力通信网络电话语音识别方法,针对电力线路传输中的低频干扰与高频细节损失问题,采用带阻滤波器预处理电力通信网...
关键词:电话语音 识别方法 电力通信网络 注意力机制 激活函数 深度学习 
基于联结主义的视听语音识别方法
《吉林大学学报(工学版)》2024年第10期2984-2993,共10页车娜 朱奕明 赵剑 孙磊 史丽娟 曾现伟 
吉林省教育厅科技计划重点项目(JJKH20230675KJ);吉林省特殊教育学会重点项目(JT2022Z001);横向课题(2022JBH08L15);吉林省科技厅(YDZJ202303CGZH010,YDZJ202301ZYTS496);吉林省社会科学研究项目(JJKH20231054SK);吉林省教育科学“十四五”规划重点课题(ZD21100)。
针对视听语音识别技术存在的数据需求量大、音视频数据对齐、噪声鲁棒性等问题,深入分析了联结主义时序分类器、长短期记忆神经网络、Transformer、Conformer四类核心模型的特点与优势,归纳了各模型的适用场景,并提出了优化模型性能的...
关键词:计算机应用技术 视听语音识别 深度学习 联结主义 
基于融合特征ADRMFCC的语音识别方法被引量:1
《吉林大学学报(理学版)》2024年第4期943-950,共8页朵琳 马建 韦贵香 唐剑 
国家自然科学基金(批准号:61962032)。
针对在复杂噪声环境下语音识别准确率低和鲁棒性差的问题,提出一种基于增减残差Mel倒谱融合特征的语音识别方法.该方法首先利用增减分量法筛选关键语音特征,然后将其映射到Mel域-残差域空间坐标系中生成增减残差Mel倒谱系数,最后将这些...
关键词:语音识别 残差Mel倒谱系数 特征筛选 增减分量法 
基于Conformer的端到端语音识别方法被引量:3
《计算机应用研究》2024年第7期2018-2024,共7页胡从刚 申艺翔 孙永奇 赵思聪 
科技创新2030——“新一代人工智能”重大资助项目(2021ZD0113002)。
针对Conformer编码器的声学输入网络对FBank语音信息提取不足和通道特征信息缺失问题,提出一种RepVGG-SE-Conformer的端到端语音识别方法。首先,利用RepVGG的多分支结构,增强模型的语音信息提取能力,而在模型推理时通过结构重参数化将...
关键词:语音识别 CONFORMER RepVGG 压缩和激励网络 
基于FPGA的卷积神经网络语音识别方法被引量:1
《信息技术》2023年第11期22-27,共6页吴宇航 何军 
国家自然科学基金(61601230)。
近年来,卷积神经网络(CNN)已经广泛应用于语音信号识别。为满足嵌入式应用领域低延时、低功耗、可移动等方面的需求,基于轻量化的卷积神经网络模型,实现了一种应用于现场可编程逻辑门阵列(FPGA)的语音识别系统。通过Vivado中的高层次综...
关键词:语音识别 卷积神经网络 现场可编程逻辑门阵列(FPGA) 高层次综合 
面向变电站智能运检的声音谱特征语音识别方法被引量:4
《高压电器》2023年第11期40-47,共8页高宝明 孙国繁 冯俊杰 段雨松 刘霄 杨爱民 
2022年国网山西省电力公司科技项目资助(520510220005)。
语音识别是变电站智能运检中关键的人机交互技术。然而,由于生产环境中存在使用专业术语多和噪声大的问题,传统的语音识别方法的效果受限。为此,文中提出了一种基于声音谱特征的语音识别方法。通过融合MFCC与CQT谱,形成一种基于声音谱...
关键词:智能运检 语音识别 声音谱特性 分布估计 卷积神经网络 
基于自然语言处理的电力调度语音识别方法被引量:2
《微型电脑应用》2023年第6期171-174,共4页胡州明 唐冬来 李玉 朱海萍 宋卫平 颜涛 
为了解决新能源电站调度中存在语音交流处理能力不足、语音识别准确率低的问题,提出了一种基于自然语言处理的电力虚拟调度方法。通过动态时间规整算法提取新能源场站调度语音中的特征信息;采用自然语言处理将调度语音的特征信息进行预...
关键词:电力调度 语音识别 自认语言处理 词袋特征 
一种改进的线性注意力机制语音识别方法被引量:1
《信号处理》2023年第3期516-525,共10页李宜亭 屈丹 杨绪魁 张昊 沈小龙 
国家自然科学基金(62171470);河南省中原科技创新领军人才项目(234200510019);河南省自然科学基金面上项目(232300421240)。
Conformer模型因其优越的性能,吸引了越来越多研究者的关注,逐渐成为语音识别领域的主流模型,但因其采用注意力机制从输入中提取信息,需要对输入序列中所有样本点进行交互计算,导致网络计算复杂度为输入序列长度的平方,因此在对长语音...
关键词:语音识别 端到端 高效注意力 连接时序分类 CONFORMER 
大词汇量环境噪声下的多模态视听语音识别方法被引量:4
《广西科学》2023年第1期52-60,共9页吴兰 杨攀 李斌全 王涵 
国家自然科学基金项目(61973103);河南省自然科学基金项目(222300420039);郑州市科技局自然科学项目(21ZZXTCX01)资助。
视听语音识别(Audio-Visual Speech Recognition,AVSR)技术利用唇读和语音识别(Audio-Visual Speech Recognition,AVSR)的关联性和互补性可有效提高字符识别准确率。针对唇读的识别率远低于语音识别、语音信号易受噪声破坏、现有的视听...
关键词:注意力机制 多模态 视听语音识别 唇读 语音识别 
检索报告 对象比较 聚类工具 使用帮助 返回顶部