一种改进的基于说话者的语音分割算法  被引量:17

An Improved Speaker Based Speech Segmentation Algorithm

在线阅读下载全文

作  者:卢坚[1,2] 毛兵[1,2] 孙正兴[1,2] 张福炎[1,2] 

机构地区:[1]南京大学计算机科学与技术系,江苏南京210093 [2]南京大学计算机软件新技术国家重点实验室,江苏南京210093

出  处:《软件学报》2002年第2期274-279,共6页Journal of Software

基  金:国家自然科学基金资助项目(69903006;60073030)~~

摘  要:: 语音分割是语音识别和语音文档检索等众多语音应用的基础.提出一种改进的基于说话者的语音分割算法,对GLR和BIC相结合的算法作进一步的改进:(1) 基于GLR距离方差的自适应阈值调整算法改进了不同声学特征下基于距离的语音分割算法中的阈值选取方法;(2) 引入BIC可测度概念来度量其适用范围;(3) BIC信息准则校准非冗余的候选分割点的偏差.实验结果表明,此改进算法优于原算法.Speech segmentation is the foundation of some applications such as speech recognition and spoken document retrieval. An improved algorithm is proposed here which include: (1) GLR variance based threshold adaptive algorithm is to improve the threshold selection approach in speaker based speech segmentation under various acoustic environments;(2) BICs Detection Ability is referred to determine when BIC is effective;(3) Besides to verify the candidate segmentation points, BIC is used to calibrate their bias caused by GLR variance. Experimental results indicate that the improved algorithm is prior to the original one.

关 键 词:贝叶斯信息准则 语音分割算法 说话者 语音识别 

分 类 号:TN912.34[电子电信—通信与信息系统] TP391[电子电信—信息与通信工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象