基于DTW的语音关键词检出  被引量:11

Spoken term detection based on DTW

在线阅读下载全文

作  者:侯靖勇 谢磊[1] 杨鹏[1] 肖雄[2] 梁祥智 徐海华[2] 王磊 吕航[1] 马斌 CHNG EngSiong 李海洲[2,3,4] 

机构地区:[1]西北工业大学计算机学院,陕西省语音与图像信息处理重点实验室 [2]南洋理工大学Temasek实验室 [3]新加坡科技局资讯通信研究院,人类语言技术部 [4]南洋理工大学计算机工程学院

出  处:《清华大学学报(自然科学版)》2017年第1期18-23,共6页Journal of Tsinghua University(Science and Technology)

基  金:国家自然科学基金面上项目(61571363)

摘  要:针对少资源语言的语音关键词检出技术受到了广泛关注。该文在基于动态时间规整(dynamic time warping,DTW)的关键词检出框架下,提出了基于音素边界的局部匹配策略,用以解决基于样例的语音关键词检出任务中的近似查询问题。在QUESST 2014评测数据上采用多种特征进行了实验验证。实验结果显示:基于音素边界的局部匹配策略不仅在近似查询T2和T3任务上的检出效果明显提升,在精确查询T1任务上也获得了有效提升。随后的系统融合实验表明,该策略能够大幅提升融合系统的性能。Spoken term detection (STD) for low resource languages has drawn much interest. A partial matching strategy based on phoneme boundaries is presented here to solve the fuzzy matching problem in query-by-example spoken term detection with dynamic time warping. A variety of features were used to validate the strategy on the QUESST 2014 dataset. Tests show that this strategy is not only quite effective for fuzzy match tasks T2 and T3 but also effective for the exact match task T1. This strategy has significantly improved performance in fusion tests.

关 键 词:语音关键词检出 少资源语言 动态时间规整 局部匹配 

分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象