国家自然科学基金(61371193)

作品数:54被引量:222H指数:9
导出分析报告
相关作者:张雪英孙颖畅江张卫黄丽霞更多>>
相关机构:太原理工大学山西省人民医院山西水利职业技术学院忻州师范学院更多>>
相关期刊:《计算机仿真》《计算机工程与设计》《清华大学学报(自然科学版)》《西安电子科技大学学报》更多>>
相关主题:语音情感识别情感语音情感识别支持向量机语音增强更多>>
相关领域:电子电信自动化与计算机技术生物学医药卫生更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
结合注意力机制和特征融合1DCNN的脑电情感识别被引量:2
《计算机工程与应用》2023年第13期171-177,共7页闫超 张雪英 张静 陈桂军 黄丽霞 
国家自然科学基金(61371193);山西省回国留学人员科研资助项目(HGKY2019025)。
针对脑电情感识别领域中处理一维数据时将其映射为二维或三维数据,然后利用2DCNN或3DCNN模型进行处理和识别时,存在参数量大且参数寻优方法费时费力的问题,提出一种基于频段和脑区注意力机制的1DCNN模型。对脑电信号提取特征并采用t检...
关键词:脑电情感识别 T检验 深度学习 一维卷积神经网络(1DCNN) 注意力机制 
基于主辅网络特征融合的语音情感识别被引量:9
《太原理工大学学报》2021年第5期769-774,共6页胡德生 张雪英 张静 李宝芸 
国家自然科学基金资助项目(61371193);山西省回国留学人员科研资助项目(HGKY2019025);山西省研究生教育创新计划项目(2020BY130)。
为了有效特征提取与融合提高语音情感识别率,提出了一种使用主辅网络进行深度特征融合的语音情感识别算法。首先将段特征输入BLSTM-Attention网络作为主网络,其中注意力机制能够关注语音信号中的情感信息;然后,把Mel语谱图输入CNN-GAP...
关键词:语音情感识别 主辅网络 长短时记忆单元 卷积神经网络 
改进DSB方法的语音信号多声源定位被引量:1
《计算机工程与应用》2021年第1期173-180,共8页王杰 黄丽霞 张雪英 
国家自然科学基金(61371193)。
延迟求和波束形成(DSB)在麦克风阵列信号到达角估计上有着广泛应用,然而在语音信号源下由于栅瓣等问题使得该方法对多个语音信号源方位估计不理想,此外,在实际复杂环境下,该方法受噪声混响影响,方位识别更加困难。针对这些问题,提出一...
关键词:延迟求和 波束形成 麦克风阵列 协方差矩阵 多声源定位 
VMD改进GFCC的情感语音特征提取被引量:3
《计算机工程与设计》2020年第8期2265-2270,共6页刘雨柔 张雪英 陈桂军 黄丽霞 张静 
国家自然科学基金项目(61371193);山西省应用基础研究基金项目(青年)(201701D221117)。
传统特征提取忽略了语音信号的非稳态特性,变分模态分解技术可以精细刻画语音的非平稳性,因此利用该技术将情感语音信号分解为K个固有模态函数,对每个分量做快速傅里叶变换后进行频率合成,通过Gammatone滤波器取能量对数,经离散余弦变...
关键词:特征提取 变分模态分解 变分模态分解改进Gammatone频率倒谱系数 语音情感识别 情感语音特征 
MLLR和MAP在远场噪声混响下的语音识别研究被引量:7
《计算机工程与应用》2020年第10期122-126,共5页娄英丹 徐静林 黄丽霞 张雪英 
国家自然科学基金(No.61371193)。
自适应技术可以用较少的数据来调整声学模型参数,从而达到较好的语音识别效果,它们大多用于自适应有口音的语音。将最大似然线性回归(Maximum Likelihood Linear Regression,MLLR)、最大后验概率(Maximum A Posteriori,MAP)自适应技术...
关键词:最大似然线性回归(MLLR) 最大后验概率(MAP) 环境自适应 远场语音识别 
基于聚类PSO-LSSVM模型的PAD维度预测被引量:3
《计算机应用研究》2020年第4期994-998,共5页胡艳香 孙颖 张雪英 段淑斐 
国家自然科学基金资助项目(61371193);山西省青年基金资助项目(2013021016-2);山西省研究生教育创新项目(2018SY021);山西省应用研究青年基金资助项目(201601D202045);山西省回国留学人员科研资助项目(201925);山西省自然科学基金面上项目(201901D111096)。
针对PAD(愉悦度、激活度、优势度)预测精度问题,提出将最小二乘支持向量机(least squares support vector machine,LSSVM)经粒子群优化(particle swarm optimization,PSO)算法优化再与情感聚类分析结合的聚类PSO-LSSVM模型。对TYUT2.0...
关键词:情感维度PAD 最小二乘支持向量机 粒子群优化算法 情感聚类分析 
基于DBM-LSTM的多特征语音情感识别被引量:10
《计算机工程与设计》2020年第2期465-470,共6页高帆 张雪英 黄丽霞 李宝芸 
国家自然科学基金项目(61371193);山西省研究生教育创新基金项目(2018SY023)
为增强不同情感特征的融合程度和语音情感识别模型的鲁棒性,提出一种神经网络结构DBM-LSTM用于语音情感识别。利用深度受限玻尔兹曼机的特征重构原理将不同的情感特征进行融合;利用长短时记忆单元对短时特征进行长时建模,增强语音情感...
关键词:语音情感识别 深度受限玻尔兹曼机 长短时记忆单元 柏林情感语音数据库 多特征 
麦克风阵列下互相关函数分类的声源定位被引量:5
《计算机工程与应用》2020年第4期128-133,共6页张岁岁 黄丽霞 王杰 张雪英 
国家自然科学基金(No.61371193)
传统的基于麦克风阵列的声源定位方法,往往容易受到低信噪比或高混响等不利的声学条件的影响。近年来,基于模式识别和机器学习技术的方法被用来在恶劣环境下进行声源定位。引入了一种基于Fisher判别理论的加权方法,实现了基于Fisher加...
关键词:麦克风阵列 GCC-PHAT FISHER判别 朴素贝叶斯分类器 
Gammatone域特征在IRM-DBN语音增强中的有效性研究被引量:1
《内蒙古大学学报(自然科学版)》2019年第6期666-673,共8页王卫梅 王雁 贾海蓉 
国家自然科学基金项目(61371193);山西省自然科学基金项目(201701D121058)
对于在噪声背景下的深度学习来说,好的特征提取能极大地提高语言增强的性能.研究在深度信念网络中,以目前性能最好的理想浮值掩蔽为学习目标,验证Gammatone域特征的语音增强效果优于其他域特征.首先,分别提取在不同噪声不同信噪比下的基...
关键词:特征提取 深度信念网络 理想浮值掩蔽 Gammatone域 语音增强 
构音障碍发音异常运动区间分布研究被引量:3
《计算机工程与应用》2019年第24期208-213,共6页闫密密 张雪英 段淑斐 
国家自然科学基金(No.61371193);山西省应用研究青年基金(No.201601D202045);太原理工大学第四层次引进人才科研启动金(No.tyut-rc201405b)
为研究构音障碍患者和正常人发音运动数据的差异,利用多伦多大学开发的TORGO数据库,采用对数正态分布拟合及正态分布拟合的方法,分别以25 mm和2.58个标准差为阈值,对比分析构音障碍患者和正常人在舌根、舌中、舌尖处的发音异常运动区间...
关键词:构音障碍 发音运动 区间分布 电磁发音仪(EMA) 
检索报告 对象比较 聚类工具 使用帮助 返回顶部