高质量的0.6kb/s声码器算法  被引量:24

High quality 0.6 kb/s speech coding algorithm

在线阅读下载全文

作  者:张建伟[1] 贺天宏[1] 李军林[1] 崔慧娟[1] 唐昆[1] 

机构地区:[1]清华大学电子工程系,北京100084

出  处:《清华大学学报(自然科学版)》2003年第4期449-452,共4页Journal of Tsinghua University(Science and Technology)

基  金:国家自然科学基金资助项目 ( 69972 0 2 0 )

摘  要:为满足语音信息存贮和交流对极低速率下语音压缩编码的需求 ,提出了一种 0 .6 kb/ s声码器算法。此算法基于线性预测正弦激励模型 ,在极低码率下获得高质量的合成语音 ,提出清浊音定位和量化方法 ,应用了多帧参数联合矢量量化技术 ,以及多带正弦混合激励、谱增强等技术。主观听觉测试显示 ,在 0 .6 kb/ s的速率下 ,此声码器合成语音不仅具有高可懂度而且具有一定的自然度 ,诊断押韵测试 (DRT)的分数为 89.5 % ,而且在 10 - 2的随机误码的信道条件下仍然具有很好的可懂度。实验表明A 0.6 kb/s high quality vocoder was developed to encode phonetic information at very low bit rates. The algorithm is based on a sinusoidally excited linear prediction model and uses multi frame joint vector quantification, multi band mixing excitation, sub band voicing strength parameter prediction, and adaptive spectral enhancement to obtain high quality synthetic speech with a low bit rate. Simulation results show that the synthesized speech is intelligible with reasonable naturalness. The diagnostic rhyme test score was 89.5% in the formal test. The vocoder is robust in a noisy environment and is still intelligible with a bit error rate of 10 -2 . The results suggest that the use of relative frame parameters and vector qualitification can greatly reduce the bit rate while maintaining clarity.

关 键 词:声码器 线性预测 矢量量化 混合正弦激励 谱增强 语音压缩编码 语音合成 

分 类 号:TN912.3[电子电信—通信与信息系统]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象