郭武

作品数:58被引量:182H指数:8
导出分析报告
供职机构:中国科学技术大学更多>>
发文主题:说话人确认说话人识别语音识别支持向量机神经网络更多>>
发文领域:电子电信自动化与计算机技术语言文字更多>>
发文期刊:《电子与信息学报》《信号处理》《自动化学报》《计算机仿真》更多>>
所获基金:国家自然科学基金国家高技术研究发展计划安徽省自然科学基金中央高校基本科研业务费专项资金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于自注意力机制的音频对抗样本生成方法被引量:1
《数据采集与处理》2024年第2期416-423,共8页李珠海 郭武 
随着个人语音数据在网络上的传播以及自动说话人识别算法的发展,个人的声纹特征面对着泄露的风险。音频对抗样本可以在人耳主观听觉不变的前提下,使得自动说话人识别算法失效,从而保护个人的声纹特征。本文在典型的音频对抗样本生成算法...
关键词:自注意力机制 对抗样本 说话人识别 深度神经网络 
基于预训练与音素字节对编码的越南语识别被引量:2
《数据采集与处理》2023年第1期101-110,共10页沈之杰 郭武 
国家自然科学基金(U1836219)。
基于无监督预训练技术的wav2vec 2.0在许多低资源语种上获得了良好的性能,成为研究的热点。本文在预训练模型的基础上进行越南语连续语音识别。将语音学信息引入到基于链接时序分类代价函数(Connectionist temporal classification,CTC...
关键词:低资源语音识别 建模单元 字节对编码 音素子词 预训练 越南语识别 
融合声学特征和深度特征的语音文档分类
《数据采集与处理》2021年第5期932-938,共7页刘谭 郭武 
传统的语音文档分类系统通常是基于语音识别系统所转录的文本实现的,识别错误会严重影响到这类系统的性能。尽管将语音和识别文本融合可以一定程度上减轻识别错误的影响,但大多数融合都是在表示向量层面融合,没有充分利用语音声学和语...
关键词:神经网络 语音文档分类 语音识别 深度特征 门控机制 
基于内容的x⁃vector文本相关SV研究被引量:1
《数据采集与处理》2020年第5期850-857,共8页陈亚峰 郭武 
x‑vector系统将一段不定长的语音通过神经网络映射成固定维的矢量来表征说话人信息,该系统在文本无关的说话人确认(Speaker verification,SV)任务中取得了优异的性能。本文将其应用到文本相关的SV任务中,在x‑vector模型选择上,采用残差...
关键词:说话人确认 文本相关 深度神经网络 声纹特征 
不平衡训练数据下的基于深度学习的文本分类被引量:21
《小型微型计算机系统》2020年第1期1-5,共5页陈志 郭武 
国家重点研发计划专项资助项目(2016YFB1001303)资助
近几年来,随着词向量和各种神经网络模型在自然语言处理上的成功应用,基于神经网络的文本分类方法开始成为研究主流.但是当不同类别的训练数据不均衡时,训练得到的神经网络模型会由多数类所主导,分类结果往往倾向多数类,极大彩响了分类...
关键词:不平衡数据集 词向量 卷积神经网络 文本分类 
端到端维吾尔语语音识别研究被引量:2
《小型微型计算机系统》2020年第1期19-23,共5页丁枫林 郭武 孙健 
科技部国家重点研发计划16年项目(YF2100060003)资助
近几年来,基于端到端模型的语音识别系统因其相较于传统混合模型的结构简洁性和易于训练性而得到广泛的应用,并在汉语和英语等大语种上取得了显著的效果.本文将自注意力机制和链接时序分类损失代价函数相结合,将这种端到端模型应用到维...
关键词:语音识别 维吾尔语 端到端 自注意力 字节对编码 链接时序分类 
说话人确认中基于无监督聚类的得分规整被引量:1
《数据采集与处理》2019年第5期837-843,共7页古斌 郭武 
在说话人确认任务中,得分规整可有效调整测试得分分布,使每个说话人的得分分布接近同一分布,从而提升系统整体性能。直接从开发集中获得针对待识别目标说话人的大量冒认者得分,利用无监督聚类手段对这些得分进行筛选,并采用混合高斯模...
关键词:说话人确认 得分规整 无监督聚类 
基于链接时序分类的日语语音识别被引量:3
《小型微型计算机系统》2018年第10期2129-2133,共5页孙健 郭武 
国家重点研发计划专项项目(2016YFB1001303)资助
目前,端到端的语音识别系统因其简洁性和高效性成为大规模连续语音识别的发展趋势.本文将基于链接时序分类的端到端技术应用到日语语音识别上,考虑到日语中平假名、片假名和日语汉字多种书写形式的特性,通过在日语数据集上的实验,探讨...
关键词:语音识别 日语 链接时序分类 端到端 
基于解码多候选结果的半监督数据挑选的语音识别被引量:1
《模式识别与人工智能》2018年第7期662-667,共6页王兮楼 郭武 解传栋 
基于资源稀少情况下的语音识别,提出针对大量无标注数据的半监督学习的挑选策略,应用到声学模型和语言模型建模.采用少量数据训练种子模型后,解码无标注数据.首先在解码的最佳候选结果中采用置信度与困惑度结合的方法挑选高可信的语句...
关键词:置信度 半监督学习 多候选 低资源 
基于句子级BLEU指标挑选数据的半监督神经机器翻译被引量:5
《模式识别与人工智能》2017年第10期937-942,共6页叶绍林 郭武 
国家重点研发计划专项项目(No.2016YFB1001303)资助~~
在单语语料的使用上,统计机器翻译可通过利用语言模型提高性能,而神经机器翻译很难通过这种方法有效利用单语语料.针对此问题,文中提出基于句子级双语评估替补(BLEU)指标挑选数据的半监督神经网络翻译模型.分别利用统计机器翻译和神经...
关键词:半监督 句子级双语评估替补(BLEU) 神经机器翻译 
检索报告 对象比较 聚类工具 使用帮助 返回顶部