李艳雄

作品数:30被引量:102H指数:6
导出分析报告
供职机构:华南理工大学更多>>
发文主题:语音说话人音频网络预加重更多>>
发文领域:电子电信自动化与计算机技术建筑科学文化科学更多>>
发文期刊:《声学与电子工程》《科学技术与工程》《华南理工大学学报(自然科学版)》《计算机工程与应用》更多>>
所获基金:国家自然科学基金中央高校基本科研业务费专项资金广东省自然科学基金湖南省教育厅科研基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于特征空间轨迹信息的语音关键词检测方法被引量:1
《电子学报》2023年第10期2915-2924,共10页田颖慧 贺前华 郑若伟 危卓 李艳雄 
广东省自然科学基金(No.2022A1515011687);国家自然科学基金(No.61571192)。
当前语音关键词检测的主流技术为深度学习,需要大规模标注样本进行训练,难以应用于更普遍的低资源场景.本文提出一种基于音频特征空间轨迹信息的低资源语音关键词检测方法,该方法基于“词是由更小语言单元(音节、音素)的结构化组成,以...
关键词:语音关键词检测 音频特征空间 特征空间轨迹信息 低资源 
基于联合学习框架的音频场景聚类
《电子学报》2021年第10期2041-2047,共7页张聿晗 李艳雄 江钟杰 陈昊 
国家自然科学基金(No.61771200)。
音频场景聚类的任务是将属于相同音频场景的音频样本合并到同一个类中.本文提出一种基于联合学习框架的音频场景聚类方法.该框架由一个卷积自编码网络(Convolution Autoencoder Network,CAN)与一个判别性聚类网络(Discriminative Cluste...
关键词:音频场景聚类 联合学习框架 卷积自编码网络 判别性聚类网络 
基于偏好排序淘汰NSGAII算法的短波网络多区域重点覆盖优化方法被引量:6
《电子与信息学报》2017年第8期1779-1787,共9页李新超 贺前华 李艳雄 朱铮宇 
国家自然科学基金(61571192);广东省公益研究(2015A 010103003)~~
在采用偏好NSGAII算法求解多子区域重点覆盖的短波网络频率优化指配时,针对算法中非支配排序耗时较多的问题,该文提出一种偏好排序淘汰的NSGAII算法。在进行非支配排序前,根据解的偏好评价排序结果淘汰一部分偏好评价较差的解,减少参与...
关键词:短波网络 频率指配 多目标优化 非支配排序 偏好排序淘汰 
基于凝聚信息瓶颈的音频事件聚类方法被引量:7
《电子学报》2017年第5期1064-1071,共8页李艳雄 王琴 张雪 邹领 
国家自然科学基金(No.61101160);中央高校基本科研业务费专项资金重点项目(No.2015ZZ102);广州市珠江科技新星专项(No.2013J2200070)
为了进一步提高音频事件聚类算法性能,本文基于凝聚信息瓶颈理论提出一种音频事件聚类方法.首先,论述信息瓶颈原理及其推导过程;然后,详细论述一种基于凝聚信息瓶颈的音频事件聚类方法,包括源变量、相关变量和目标变量的定义,聚类的具...
关键词:凝聚信息瓶颈 音频事件聚类 音频内容分析 
说话人聚类的初始类生成方法
《计算机工程与应用》2017年第3期149-153,共5页赖松轩 李艳雄 
国家自然科学基金(No.61101160);广州市珠江科技新星专项(No.2013J2200070);华南理工大学大学生课外创新训练项目;中央高校基本科研业务费本科生自主选题项目(No.10561201501)
目前说话人聚类时将说话人分割后的语音段作为初始类,直接对这些数量庞大语音段进行聚类的计算量非常大。为了降低说话人聚类时的计算量,提出一种面向说话人聚类的初始类生成方法。提取说话人分割后语音段的特征参数及特征参数的质心,...
关键词:层次聚类 贝叶斯信息准则 说话人聚类 初始类 语音信号处理 
复杂环境下基于准干净语音的音质评价方法被引量:4
《华中科技大学学报(自然科学版)》2016年第7期121-126,共6页周伟力 贺前华 李艳雄 刘杨 
国家自然科学基金资助项目(61571192);广东省公益基金资助项目(2015A010103003)
提出一种新的复杂环境噪声下无参考源语音质量客观评价方法.该方法基于准干净语音构造和有参考源评价模型,实现接近于有参考源客观评价的性能.首先,采用改进的最小值控制递归平均算法和多带谱减法获得带噪语音的准干净语音;然后,将该准...
关键词:语音质量 客观评价 无参考源 复杂环境 准干净语音构造 
基于互信息扩散蚁群算法的短波频率优化指配被引量:6
《华中科技大学学报(自然科学版)》2016年第4期6-11,共6页李新超 贺前华 李艳雄 朱铮宇 
国家自然科学基金资助项目(61571192)
为提高求解不对等短波网络频率指配问题的速度和效果,基于邻近短波通信频率区域覆盖近似的特点,采用互信息系数描述其近似程度,提出了互信息扩散蚁群算法.蚁群根据当前用频方案的覆盖效果对方案中台站频率组合释放信息素的同时,依据邻...
关键词:短波通信 频率指配 互信息 蚁群算法 信息素扩散 
基于深层说话人矢量的说话人检索
《华中科技大学学报(自然科学版)》2015年第7期62-65,共4页李威 杨继臣 贺前华 李艳雄 
国家自然科学基金资助项目(61301300);中国博士后科学基金资助项目(2013M531850);中央高校基本科研业务费资助项目(2013ZM0097)
为了解决浅层特征不能有效刻画说话人特征,导致说话人检索率不高的问题,提出了一种基于深层说话人矢量的说话人检索方法.使用受限波尔兹曼机逐层构建一个多层的深层特征提取器用以提取说话人深层特征.为说话人构建基于深层特征的深层说...
关键词:深层特征 深层说话人矢量 最小距离 说话人检索 检索率 
说话人认证录音回放检测方法综述被引量:1
《数据采集与处理》2015年第2期266-274,共9页贺前华 潘伟锵 胡永健 朱铮宇 李艳雄 奉小慧 
国家自然科学基金(60972132)资助项目
基于生物特征的身份认证已得到学术界及企业的高度重视,指纹、人脸识别应用已非常普遍,但对于非现场身份认证,语音相对其他生物特征,具有用户接受程度高、拾音设备简单、随时随地可用、数据量小、计算复杂度低等优势,因此基于声纹的身...
关键词:说话人认证 认证语音真实性 录音回放攻击 
基于语速差异的新闻发布会中首要说话人检测
《计算机工程与应用》2015年第4期222-225,231,共5页吴伟 李艳雄 王梓里 陈祝允 
国家自然科学基金项目(No.61101160);广州市珠江科技新星专项(No.2013J2200070);中央高校基本科研业务费专项资金重点项目(No.2013ZZ053);国家级大学生创新训练项目(No.201210561046);广东省大学生创新训练项目(No.1056112028)
新闻发布会中,首要说话人(例如政府要员)通常要即兴回答记者事先准备好的问题。因而首要说话人语速一般很慢,而其他说话人(例如记者、翻译等)语速则相对较快。基于两者的语速差异,采用一个滑动窗从连续语音流中截取语音段,再估计各音段...
关键词:新闻发布会语音 语速差异 首要说话人 说话人分割 说话人聚类 
检索报告 对象比较 聚类工具 使用帮助 返回顶部