连续语音识别

作品数:177被引量:544H指数:11
导出分析报告
相关领域:电子电信自动化与计算机技术更多>>
相关作者:王作英吴文虎蒋冬梅屈丹徐波更多>>
相关机构:清华大学中国科学院解放军信息工程大学中国科学院自动化研究所更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划广西壮族自治区自然科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
双通道解码的端到端连续语音识别
《桂林电子科技大学学报》2024年第2期167-173,共7页朱洋 曾庆宁 赵学军 
国家自然科学基金(61961009);广西无线宽带通信与信号处理重点实验室基金(GXKL06200107);桂林电子科技大学研究生教育创新计划(2022YCXS042)。
在端到端连续语音识别系统中,完全基于自注意力机制的Transformer模型相比传统的混合模型提高了准确率。Conformer模型是在Transformer模型基础上增加一个擅长提取局部特征的卷积模块,将该模型作为整个识别系统的编码器,解码器使用注意...
关键词:语音识别 编码器 解码器 端到端 双通道 语言模型 
让人工神经网络学习语音识别(3) 探索连续语音识别的奥秘
《无线电》2023年第10期81-85,共5页赵竞成 胡博扬 
如果不满足仅仅用语音控制机器,而是希望和语音助手、对话机器人进行语言交流,表达比较复杂的语义甚至情感,那么对基于孤立词语音识别技术的模型来说就太难了。想打造类似Windows操作系统或智能手机语音助手那样的语音识别系统,对于爱...
关键词:WINDOWS操作系统 人工神经网络 连续语音识别 语音识别系统 语音控制 智能手机 机器人 孤立词语音识别 
低资源少样本连续语音识别最新进展被引量:4
《郑州大学学报(工学版)》2023年第4期1-9,共9页屈丹 杨绪魁 闫红刚 陈雅淇 牛铜 
国家自然科学基金资助项目(62171470);河南省中原科技创新领军人才项目(234200510019)。
低资源少样本语音识别是目前语音识别行业面临的迫切技术需求。首先,总结了低资源连续语音识别技术的框架技术,重点介绍了低资源语音在特征提取、声学建模和资源扩展等方面的若干关键技术研究进展。其次,在连续语音识别框架技术发展的...
关键词:低资源少样本 连续语音识别 生成对抗网络 自监督表示学习 深度强化学习 元学习 
面向连续语音识别的土耳其语音系研究被引量:1
《解放军外国语学院学报》2021年第6期82-89,134,共9页丁慧君 
国家自然科学基金重大项目“多语言言语识别基础理论和建模方法”课题--“多语言言语数据的获取、标注和分析研究”(11590771)。
语音信号复杂而多变,在连续语音识别过程中,有针对性的语音知识可以帮助机器克服信号限制提高识别率。音系是一套完整的语言符号系统,它以数量有限的基本单位产生数量无限的形式单位。在土耳其语中,音系单位的排列组合是有章可循的,分...
关键词:语音识别 土耳其语 音系 形态 
基于Transformer的越南语连续语音识别被引量:2
《信息工程大学学报》2020年第2期129-133,152,共6页刘佳文 屈丹 杨绪魁 张昊 唐君 
国家自然科学基金资助项目(61673395)。
针对现有越南语语音识别模型大量使用循环神经网络,无法并行训练,模型收敛速度慢的问题,构建基于transformer的端到端语音识别模型,加快模型训练的同时,减少对语言学知识的依赖。通过分析越南语发音规律,系统以音素作为识别单元,对识别...
关键词:越南语 TRANSFORMER 端到端 语音识别 
基于连续语音识别的码本数据信息优化研究
《北华航天工业学院学报》2020年第1期11-13,共3页魏艳娜 
廊坊市科技局科技支撑计划项目(2017011061).
在语音识别技术中,矢量量化起着非常关键的作用。矢量量化的码本设计过程中,经典的LBG算法对初始码本非常敏感,初始码本的选取不但影响迭代的收敛速度,很大程度上还影响最终码本的性能。本文提出一种新的初始码本生成算法,通过距离调节...
关键词:语音识别 码本优化 矢量量化 初始码本 
基于隐马尔可夫模型的连续语音同步识别系统被引量:12
《现代电子技术》2019年第11期64-67,71,共5页李玉华 
江西省级教改课题:网络环境下独立学院非英语专业大学生英语听力学习策略的研究与实践(JXJG-08-78-17);江西省社会科学规划项目:基于CBI的大学英语ESP教学改革探究——以独立学院“旅游管理”专业为例(15WX316)~~
语音同步识别系统的发展方向是连续性的人机交互,采用传统系统易受到突发性噪声影响,致使识别效果较差,提出基于隐马尔可夫模型的连续语音同步识别系统。结合语音识别原理,设计系统硬件总体结构。利用JFET输入高保真运放的OPA604低通滤...
关键词:隐马尔可夫模型 连续语音识别 同步识别 信号处理 人机交互 系统结构设计 
基于瓶颈特征的藏语拉萨话连续语音识别研究被引量:9
《北京大学学报(自然科学版)》2018年第2期249-254,共6页周楠 赵悦 李要嫱 徐晓娜 才旺拉姆 吴立成 
教育部人文社会科学规划基金(15YJAZH120);中央民族大学双一流学科建设项目资助
基于从深度神经网络提取的瓶颈特征具有语音长时相关性和紧凑表示的特点,将瓶颈特征及其与MFCC的复合特征用于藏语连续语音识别任务中,可以代替传统的MFCC特征进行GMM-HMM声学建模。在藏语拉萨话连续语音识别任务中的实验表明,瓶颈特征...
关键词:藏语拉萨话 连续语音识别 高斯混合–隐马尔科夫模型 瓶颈特征 深度神经网络 
基于非负矩阵分解的语音深层低维特征提取方法被引量:4
《数据采集与处理》2017年第5期921-930,共10页秦楚雄 张连海 
国家自然科学基金(61175017;61403415)资助项目
作为一种基于深层神经网络提取的低维特征,瓶颈特征在连续语音识别中取得了很大的成功。然而训练瓶颈结构的深层神经网络时,瓶颈层的存在会降低网络输出层的帧准确率,进而反过来影响该特征的性能。针对这一问题,本文基于非负矩阵分解算...
关键词:连续语音识别 深层神经网络 半非负矩阵分解 凸非负矩阵分解 低维特征 
科大讯飞:听见中国智能语音技术最强音
《大学生》2017年第5期78-79,共2页杨玄章 
新生报到季,某校刚刚入学的新同学没有像以往一样领到厚厚的一本新生指南,取而代之的是一个叫“新生助手”的小盒子或者手机“小马甲”。在这个陌生的环境下,这个“新生助手”就成为了同学们融入校园生活最可靠的伙伴了。
关键词:科大讯飞 语音技术 语音识别技术 一本 连续语音识别 语音识别领域 声纹识别 互联互通 语音系统 谷歌 
检索报告 对象比较 聚类工具 使用帮助 返回顶部