音素关联的多文种语音融合编码方法  被引量:6

Phonemes associated multilingual speech fusion coding method

在线阅读下载全文

作  者:孙广武[1] 戴永[1] 喻世东[1] 李璇[1] 

机构地区:[1]湘潭大学智能计算与信息处理教育部重点实验室,湖南湘潭411105

出  处:《计算机工程与应用》2013年第19期217-221,共5页Computer Engineering and Applications

基  金:湖南省高校创新平台开放基金(No.09K040);湖南省“十二五”重点学科建设项目

摘  要:依据异类文种之间、同类文种不同语音之间存在音素数据关联的特性,提出多文种语音数据融合编码方法。将不同文种存在的相同音素数据段块按段块模板截取语音样本序列,小波变换,提取特征矢量,生成共享模板集;任意字音或语句音串均按共享模板集提供的元素进行编码与解码;以模板音素串构成的语音记录库按(音节、音素)索引。实验结果表明,单字语音数据压缩比、语音数据存储量、语音还原分段信噪比、主观评价得分等参数均明显优于已有方法,语音还原质量良好。Multilingual speech data fusion coding method is proposed according to the phoneme data correlation properties, which exist among heterogeneous languages and different words in the same language. Voice sample sequences of the same phoneme data segment in different languages are intercepted according to the segment templates, wavelet transform is done to those sequences, then feature vectors is extracted to generate shared template sets. Speech data of any word or sentence are coded or decoded according to the template sets. The speech record database made up of template phoneme sets is indexed according to (syllable, phoneme)structure. The single word compression ratio, speech data size, segmental signal-to-noise ratio(SNRS)and score of subjective evaluation(MOS)are significantly better than existing methods, also the voice restoration is of good quality.

关 键 词:语音 音素 关联 多文种 融合编码 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象