谢湘

作品数:35被引量:102H指数:6
导出分析报告
供职机构:北京理工大学信息与电子学院更多>>
发文主题:语音识别语音支持向量机模式识别语音质量更多>>
发文领域:电子电信自动化与计算机技术语言文字文化科学更多>>
发文期刊:《清华大学学报(自然科学版)》《声学学报》《电声技术》《兵工学报》更多>>
所获基金:国家自然科学基金国家教育部博士点基金国家高技术研究发展计划北京市教委资助项目更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于神经网络的低码率语音编码技术研究综述
《信号处理》2024年第12期2261-2280,共20页王晶 徐亮 陈晓娇 谢湘 费泽松 
国家重点研发计划(2022YFB2902003);国家自然科学基金(62071039)。
语音编码算法在无线或网络语音的传输过程中具有重要作用,在降低语音编码速率的同时确保编码语音质量不变甚至提升一直是设计者们追求的核心目标。然而,传统语音编解码器在较低速率下经过压缩后的语音音质、可懂度和有效带宽均有明显下...
关键词:语音编码 低码率 神经网络 混合式编码器 端到端编码器 
面向虚拟现实场景的房间脉冲响应计算模型
《声学学报》2024年第6期1186-1196,共11页李知禹 王晶 岳欣雯 杨立东 赵胜辉 谢湘 
国家自然科学基金项目(62071039);内蒙古自治区科技计划项目(2023YFSW0006)资助。
提出了一种面向虚拟现实应用场景的房间脉冲响应计算模型,将深度学习神经网络技术与心理声学感知参数结合,能够高效地从虚拟现实场景信息中预测具有听觉感知意义的房间脉冲响应。在确保高质量预测结果的同时,该模型可以满足虚拟现实音...
关键词:房间脉冲响应 深度学习 感知参数 虚拟现实 
残差网络在婴幼儿哭声识别中的应用被引量:7
《电子与信息学报》2019年第1期233-239,共7页谢湘 张立强 王晶 
国家自然科学基金(61473041;11590772;61571044)~~
该文使用语谱图结合残差网络的深度学习模型进行婴幼儿哭声的识别,使用婴幼儿哭声与非哭声样本比例均衡的语料库,经过五折交叉验证,与支持向量机(SVM),卷积神经网络(CNN),基于Gammatone滤波器的听觉谱残差网络(GT-Resnet)3种模型相比,...
关键词:婴儿哭声识别 深度学习 残差网络 语谱图 
飞行驾驶员的应答方式识别被引量:3
《北京理工大学学报》2017年第7期744-747,共4页谢湘 唐刚 肖泽苹 李通 
国家自然科学基金资助项目(61473041;11590772;11590770)
飞机驾驶员在飞行过程中有各种各样的说话方式,如带情感的对话、快速与慢速、大声与小声等.并且在飞行的状态下还需要承受物理与心理压力,对话语音还会产生变异,如果不做任何处理,直接用于传统的说话人识别系统以及语音识别系统来处理,...
关键词:副语言学 语音信号 说话方式识别 
三维音频质量评价方法
《电声技术》2017年第7期131-134,139,共5页刘继月 王晶 谢湘 董桂官 
国家自然科学基金项目(61571044;11461141004;11590772)
随着三维(Three Dimension,3D)音频技术的发展,与之相配合的三维音频质量评价方法也越来越受到广泛的关注。当前的三维音频质量评价方法主要包括两大类:主观评价方法与客观评价方法。主观评价由于其直观性和可靠性而成为音频质量评价的...
关键词:三维音频 质量评价 主观评价 客观评价 数据挖掘 
基于低秩张量补全的多声道音频信号恢复方法被引量:5
《电子与信息学报》2016年第2期394-399,共6页杨立东 王晶 谢湘 赵毅 匡镜明 
国家自然科学基金(61473041);内蒙古高校科研项目(NJZY13139)~~
多声道音频信号在r采集、压缩、传输过程中可能造成音频数据丢失,为了确保给听众带来更真实的听觉感受,该文提出一种基于低秩张量补全的音频丢失数据恢复方法。首先,把多声道音频信号表示为一个张量;其次,把张量补全作为一个凸优化问题...
关键词:音频信号恢复 张量补全 迹范数 凸优化 
基于参数估计和感知提升的语音增强降噪算法被引量:2
《电子与信息学报》2016年第1期174-179,共6页王晶 尹栋 蒋涉权 杨立东 谢湘 
国家自然科学基金(61473041;11461141004;61571044);北京市高等学校青年英才计划(YETP1202)~~
为了提高单通道语音增强降噪算法的整体质量,该文从噪声消除和语音感知两个角度出发对传统语音增强算法进行改进,通过引入多种处理手段来达到最佳优化效果。首先在参数估计方面,把基于弱语音出现的平滑算法加入到基于固定先验信噪比的...
关键词:语音增强 噪声功率密度估计 先验信噪比 谐波恢复 相位补偿 
基于张量分解的多声道音频恢复方法
《北京理工大学学报》2015年第11期1183-1188,共6页杨立东 王晶 赵毅 谢湘 匡镜明 
国家自然科学基金资助项目(61473041;11461141004);内蒙古高校科研项目(NJZY13139)
为恢复多声道音频在采集过程中丢失的数据,提出基于加权优化的张量分解方法.首先用张量对音频建模,并且根据其尺寸定义一个标识数据丢失位置的加权张量,然后使用加权最小二乘问题描述CANDECOMP/PARAFAC(CP)模型并通过一阶优化算法求解,...
关键词:音频恢复 张量分解 因子矩阵 CANDECOMP/PARAFAC模型 
基于非负张量分解的音频分类方法
《天津大学学报(自然科学与工程技术版)》2015年第9期761-764,共4页杨立东 谢湘 王晶 匡镜明 
国家自然科学基金资助项目(61473041);内蒙古高校科研基金资助项目(NJZY13139)
为了提高音频数据分类正确率,提出一种通过非负张量分解(NTF)的分类方法.音频信号经过预处理后,提取声学特征和感知特征参数,然后构建非负的3阶音频张量,其各阶分别对应特征、帧、样本;其次,通过NTF得到每一类音频的核张量与因子矩阵,...
关键词:音频分类 非负张量分解 特征提取 因子矩阵 
基于Tucker分解的音频分类研究被引量:3
《信号处理》2015年第2期221-225,共5页杨立东 王晶 谢湘 匡镜明 
国家自然科学基金项目资助(61001188);高等学校博士学科点专项科研基金资助项目(20101101110020);内蒙古自然科学基金资助项目(2012MS0909);内蒙古高校科研项目(NJZY13139)
提出一种利用Tucker分解获得鲁棒性较强的音频信号不同属性的特征,在高斯混合模型上测试音频信号分类性能的方法。音频信号经过预处理后,提取其不同类型特征集合,包括常规声学特征参数集合、听觉感知特征参数集合、心理声学特征参数集合...
关键词:音频分类 Tucker分解 高斯混合模型 心理声学特征 
检索报告 对象比较 聚类工具 使用帮助 返回顶部