检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:许春冬[1,2,3] 王晶[1] 战鸽 应冬文[3] 李军锋[3] 颜永红[3]
机构地区:[1]北京理工大学信息与电子学院,北京100081 [2]江西理工大学信息工程学院,江西赣州341000 [3]中国科学院声学研究所语言声学与内容理解重点实验室,北京100190
出 处:《北京理工大学学报》2015年第11期1189-1193,共5页Transactions of Beijing Institute of Technology
基 金:国家重点基础研究发展计划项目资助(2013CB32930);国家自然科学基金资助项目(61271426;10925419;90920302;61072124;11074275;11161140319;91120001);中国科学院战略性先导科技专项基金资助项目(XDA06030100;XDA06030500);国家"八六三"计划项目(2012AA012503);中科院重点部署资助项目(KGZD-EW-103-2);江西理工大学科研基金资助项目(NSFJ2015-G21)
摘 要:在复杂的声学环境中,由于环境噪声的干扰,导致声学特征的稳定性不够理想.为克服此难题,通常对决策结果在时间维度上进行平滑.然而,这些平滑过程本身没有考虑数据在时间维度上的结构特征,属于启发式的方法.该文采用动态分割的方法,将语音的频谱包络在时间维度上分割成具有特征同一性的时间块,以分割块为单位计算能量特征,并进行语音/非语音决策,从而达到提高语音端点检测的稳定性目的.实验表明,提出的方法有效提高了语音端点检测的鲁棒性.The acoustic feature is not robust enough due to the interference of environmental noises.Some heuristic approaches of smoothing noisy spectra were introduced to treat with this problem.But those methods did not consider the intrinsic correlation in the time domain.This paper presents a novel method of endpoint detection,where the time sequence of logarithmic power was partitioned into homogeneous blocks using dynamic auto-segmentation.The acoustic feature was extracted from each homogenous block.The endpoint detection was conducted based on the unit of homogenous block.The experimental results showed the superiority of the proposed method.
分 类 号:TN912.3[电子电信—通信与信息系统]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.149.241.32