检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王志翼 张红兵[1] WANG Zhiyi;ZHANG Hongbing(School of Public Security Information Technology,Criminal Investigation Police University of China,Shenyang 110035,China)
机构地区:[1]中国刑事警察学院公安信息技术与情报学院,辽宁沈阳110035
出 处:《电声技术》2023年第9期118-120,共3页Audio Engineering
基 金:2023年中央高校基本科研业务费重大项目培育计划(JYTZD2023150)。
摘 要:在可变内核机制的时延神经网络基础上,提出一种带有全局多尺度注意力机制的神经网络结构和基于Fbank和翻转梅尔频率倒谱系数(Inversed Mel-Frequency Cepstral Coefficients,IMFCC)的融合特征。在ASVspoof 2019 LA数据集上,采用等错误率和测试集准确率作为评价指标。实验结果表明,使用提出的含全局多尺度注意力机制的神经网络结构,在相同声学特征的情况下,识别准确率比ECAPA-TDNN和SKA-TDNN分别提高5.1%和4.3%。In this paper,a neural network architecture with global multi-scale attention mechanism and a fusion feature based on Fbank and Inversed Mel-Frequency Cepstral Coefficients(IMFCC)are proposed on the basis of variable kernel mechanism time delay neural network.The equal error rate and the accuracy of test set were used as the evaluation index on the ASVspoof 2019 LA data set.The experimental results show that the proposed neural network structure with global multi-scale attention mechanism can improve the recognition accuracy by 5.1%and 4.3%compared with ECAPA-TDNN and SKA-TDNN,respectively,under the same acoustic features.
分 类 号:TP183[自动化与计算机技术—控制理论与控制工程] TN912.33[自动化与计算机技术—控制科学与工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222