基于递归神经网络的藏语语音转文本应用研究  

在线阅读下载全文

作  者:彭杨 徐健 卓嘎 付好 邢立佳 

机构地区:[1]西藏大学信息科学技术学院

出  处:《互联网周刊》2024年第17期23-25,共3页China Internet Week

基  金:国家级大学生创新创业训练计划项目——深度递归神经网络在藏语语音转文字中的应用研究(编号:202410694031)。

摘  要:本文针对藏语中的卫藏方言,探讨了自动语音识别(automatic speech recognition,ASR)技术在语音识别模型构建方面的应用。利用时间递归神经网络(recurrent neural network,RNN)及其变体来提升ASR系统的性能。通过引入LAS(listen,attend and spell)模型,并结合多任务学习框架、深度卷积神经网络和改进的注意力机制,显著提升了ASR系统的性能。在实验中,改进后的LAS模型在测试集和训练集上的词错误率分别达到了12.40%和16.23%,实验结果验证了方法的有效性。

关 键 词:时间递归神经网络 自动语音识别 藏语语音 

分 类 号:TP3[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象