BP神经网络在汉语数字语音识别中的应用  

在线阅读下载全文

作  者:罗梅[1] 江丽莎[1] 罗涟玲[1] 

机构地区:[1]广西师范大学计算机科学与信息工程学院,广西桂林541004

出  处:《广西物理》2012年第3期26-28,共3页Guangxi Physics

基  金:广西自然科学基金项目(0448035)

摘  要:从语音信号产生的数字模型出发,对1~10这10个汉语数字的语音信号进行预处理,提取了Mel频率倒谱系数,并将特征参数序列进行非线性时间规整为固定的帧数,使用BP神经网络的训练和识别,研究该方法的可行性和有效性。结果表明,在噪声环境下1,7,9的识别率为80%,而2,3,4,5,6,8,10的识别率都是100%,识别率主要受噪声、不同人的发音不同等因素的影响。该方法具有可行性强、识别率高的特点,可应用于语音识别系统。

关 键 词:汉语数字语音识别 MEL频率倒谱系数 非线性时间规整 BP神经网络 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象