检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张文林[1] 屈丹[1] 李弼程[1] 王波[1] 王炳锡[1]
机构地区:[1]信息工程大学信息工程学院,河南省郑州市450002
出 处:《信号处理》2008年第4期655-658,共4页Journal of Signal Processing
基 金:国家自然科学基金项目(No.60372038)
摘 要:本文研究了一种结合"声学信息"和"音素配位学信息"进行语言辨识的新算法,首先在预处理中对语音进行自动分段,在特征层上引入带有长时信息的段级特征参数——段级移位差分倒谱,在模型层上利用高斯混合模型(Gaussi- an Mixture Model,GMM)将语音信号自动标识为符号序列,进而引入多元语言模型(Multi-gram Language Model,MLM)来对"音素配位学信息"进行建模,最后将"GMM得分"和"MLM得分"送入后端多分类支持向量机模型得到最终识别结果。相关实验表明,新系统不需手工标识的语料,识别速度快,对OGI标准语料库中的五种语言获得了开集正识率为78.84%的结果。we present a new framework for language identification using acoustic and phonotactics information of specch. First,an automatic speech segmentation algorithm is performed in the preprocessing stage,then at the feature stage the segmental shift delta eepsturm feature which carry long-term information is introduced ,at the model stage a multigram language model is developed based on the using of traditional GMM for speech tokenization. A multi-class support vector machine is used for the backend classification. Experiment results demonstrate that the new system yields good performance in the language identification task of five languages in the OGITS database.
关 键 词:语言辨识 移位差分倒谱 段级特征参数 高斯混合模型 多元语言模型 支持向量机
分 类 号:TN912.34[电子电信—通信与信息系统] TP273[电子电信—信息与通信工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222