音素识别

作品数:28被引量:44H指数:4
导出分析报告
相关领域:电子电信自动化与计算机技术更多>>
相关作者:陈杰王士进邵玉斌龙华杜庆治更多>>
相关机构:深圳市腾讯计算机系统有限公司中国科学技术大学解放军信息工程大学中国科学院自动化研究所更多>>
相关期刊:《辽宁行政学院学报》《清华大学学报(自然科学版)》《北京邮电大学学报》《计算机与网络》更多>>
相关基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划安徽省自然科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
低信噪比下基于B-Wave-U-Net特征增强的音素识别
《北京邮电大学学报》2025年第1期100-106,共7页黄辉波 邵玉斌 龙华 杜庆治 
云南省媒体融合重点实验室项目(220235205)。
针对低信噪比下音素识别准确率低的问题,提出一种基于B-Wave-U-Net特征增强的音素识别方法。首先,将双向长短期记忆(BLSTM)网络融入Wave-U-Net编码器的起始端,并从中引出支路信息流,再跳跃连接到解码器的末端,加入全连接层,从而构建出B-...
关键词:音素识别 对数梅尔尺度滤波器组能量 Wave-U-Net 双向长短期记忆 
听觉脑干植入声码器模型的开发及验证
《上海交通大学学报(医学版)》2024年第10期1279-1286,共8页张钦杰 黄穗 谭皓月 周祥 王君怡 刘雨滋 文雯 郭嘉 吴皓 贾欢 
上海市耳鼻疾病转化医学重点实验室项目(14DZ2260300);上海市黄浦区产业扶持基金(XK2019015);上海市人才发展基金(2019047);上海交通大学医学院转化医学协同创新项目(TM202011)。
目的·基于人工耳蜗(cochlear implant,CI)声码器及听觉脑干植入(auditory brainstem implant,ABI)电极阵列排布特征,开发ABI声码器并验证其可靠性。方法·通过MATLAB软件构建“n-of-m”编码策略的CI/ABI声码器。每一帧内仅选取能量最大...
关键词:听觉脑干植入 声码器 音素识别 心理声学 电极阵列拓扑 
低信噪比下基于融合网络的音素识别方法
《重庆邮电大学学报(自然科学版)》2024年第4期786-796,共11页黄辉波 邵玉斌 龙华 杜庆治 
云南省媒体融合重点实验室项目(220235205)。
针对低信噪比下音素识别准确率低的问题,提出一种新的识别方法。提取语音的Fbank特征,输入到由多头注意力机制、ResNet、BLSTM、CTC构建的A-R-B-CTC模型中进行音素识别,利用Wave-U-Net对语音特征Fbank、MFCC、GFCC、对数频谱进行图像去...
关键词:音素识别 Wave-U-Net 端到端 多头自注意力机制 Transformer模型 
声学发音模型辅助建模的发音错误检测与诊断被引量:1
《声学学报》2023年第1期264-273,共10页柳宗铭 王丽 李军锋 张鹏远 
国家重点研发计划项目(2020YFC2004100)资助。
发音错误检测与诊断(MDD)任务的专家标注数据稀缺。从添加发音模型更高效地利用有限数据建模发音规律,辅助基于音素识别的MDD的思路出发,提出一种同时融合声学和文本信息,在理论上更完备地建模发音错误产生过程的声学发音模型。基于发...
关键词:辅助建模 多任务学习 数据建模 联合优化 文本信息 发音错误 模型共享 音素识别 
基于BLSTM-CTC的语音特征的音素识别研究被引量:2
《现代计算机》2022年第10期32-38,共7页吴丹丹 夏秀渝 
音音素是自然语言中的最小建模单元,音素识别模型的优劣直接影响关键词检索、连续语音识别的性能。本文首先针对幅度特征MSRCC和相位特征PSRCC进行了一系列对比实验研究,发现融合幅度特征和相位特征可以取得更好的识别效果;接着比较分...
关键词:音素识别 深度神经网络 语音特征 
基于LSTM的关键词识别系统设计被引量:4
《计算机与网络》2022年第2期64-69,共6页何蕊伽 夏秀渝 
为快速、准确地判断语音流中是否含有关键词,提出一种基于LSTM两步检索的关键词识别系统。将连续语音流分割成独立音节,然后采用过零率直方图进行初步检索,基于过零率直方图的相似度比较的计算量小,可快速排除非关键词。对初检时判断为...
关键词:关键词识别 语音分割 音素识别 循环神经网络 过零率直方图 
基于CNN-BGRU的音素识别研究被引量:1
《云南民族大学学报(自然科学版)》2020年第5期493-500,共8页和丽华 江涛 潘文林 杨皓然 
国家自然科学基金(61363022)。
音素是一个语言体系中最小的语音单位,音素识别在大词汇语音识别任务中不受词汇和语句的限制.因此,选择音素作为识别单元,建立基于CNN-BGRU的神经网络模型,实现音素语谱图的分类.首先,使用短时傅里叶变换生成音素语谱图作为模型的输入;...
关键词:音素识别 卷积神经网络 双向门循环机制 
基于SGMM和DNN结合提高音素识别率的研究被引量:1
《计算机工程与应用》2019年第24期117-121,127,共6页贾兵兵 曹辉 秦驰杰 
国家自然科学基金(No.1202020368,No.11074159,No.11374199)
为降低声学特征在语音识别系统中的音素识别错误率,提高系统性能,提出一种子空间高斯混合模型和深度神经网络结合提取特征的方法,分析了子空间高斯混合模型的参数规模并在减少计算复杂度后将其与深度神经网络串联进一步提高音素识别率...
关键词:声学特征 音素识别 子空间高斯混合模型 深度神经网络 
连续音素的改进深信度网络的识别算法被引量:1
《应用声学》2019年第1期39-44,共6页阴法明 赵焱 赵力 
国家自然科学基金项目(61571106)
为提高连续语音识别中的音素识别率,提出一种基于改进并行回火训练的受限波尔兹曼机的音素识别算法。首先,利用经过等能量划分后的改进并行回火算法来训练受限玻尔兹曼机,接着将受限玻尔兹曼机堆叠组成一个深信度网络,从而作为深度神经...
关键词:并行回火 受限玻尔兹曼机 深信度网络 音素识别 
基于层次稀疏DBN的瓶颈特征提取方法被引量:10
《模式识别与人工智能》2015年第2期173-180,共8页王一 杨俊安 刘辉 柳林 
国家自然科学基金项目(No.60872113);安徽省自然科学基金项目(No.1208085MF94;1308085QF99)资助
针对现有语音特征无法有效利用长时段语音和监督性类别信息,及现有瓶颈特征提取方法耗时过长等缺陷,提出基于层次结构稀疏深度可信神经网络的瓶颈特征提取方法.该方法将重叠组套索作为深度可信神经网络目标函数的稀疏正则项使用,从而构...
关键词:音素识别 深度可信神经网络(DBN) 重叠组套索 层次结构 
检索报告 对象比较 聚类工具 使用帮助 返回顶部