检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:孔玲军 KONG Lingjun(Binhai College,Nankai University,Tianjin,China,300270)
机构地区:[1]南开大学滨海学院,天津300270
出 处:《福建电脑》2022年第4期50-52,共3页Journal of Fujian Computer
摘 要:近几年,延时神经网络TDNN模型在语音识别领域取得了非常好的效果。由于其具有权值共享和子采样等特点,使其减少了参数的训练规模。本文将3000小时汉语电话录音语料通过TDNN模型训练声学参数。在3000小时内的随机测试集上,TDNN的误识率比DNN降低了0.62%至1.18%。但是,在3000小时外的测试集上,DNN与TDNN的效果各有优劣,但都表现得较为稳定。The delayed neural network TDNN model has achieved very good results in the field of speech recognition.Because it has the characteristics of weight sharing and sub sampling,the training scale of parameters is reduced.This paper uses TDNN model to train the acoustic parameters of 3000 hours of Chinese telephone recording corpus.On the random test set within 3000 hours,the error rate of TDNN is reduced by 0.62%to 1.18%compared with DNN.However,in the test set beyond 3000 hours,the effects of DNN and TDNN have their own advantages and disadvantages,but they are relatively stable.
关 键 词:DNN TDNN 汉语电话录音 Kaldi 子采样
分 类 号:TP183[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.38