检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]江西师范大学计算机信息工程学院,南昌330022
出 处:《计算机工程与应用》2016年第11期158-163,共6页Computer Engineering and Applications
基 金:国家自然科学基金(No.61365004);江西省教育厅科学技术研究项目(No.GJJ12198)
摘 要:I-vector说话人识别系统常用距离来衡量说话人语音间的相似度。加权成对约束度量学习算法(WPCML)利用成对训练样本的加权约束信息训练一个用于计算马氏距离的度量矩阵。该度量矩阵表示的样本空间中,同类样本间的距离更小,非同类样本间的距离更大。在美国国家标准技术局(NIST)2008年说话人识别评测数据库(SRE08)的实验结果表明,WPCML算法训练度量矩阵用于马氏距离相似度打分,比用余弦距离相似度打分的性能更好。选择训练样本对方法用于构造度量学习训练样本集能进一步提高系统实验性能,并优于目前最流行的PLDA分类器。The i-vector speaker recognition systems usually compute the distance between the speaker utterances to determine their similarity. Weighted Pairwise Constraint Metric Learning algorithm(WPCML)trains a metric used to compute Mahalanobis distance by learning from the weighted constraints of pairwise training samples. In the sample space described by the metric, the distance between the same class samples is smaller, while that between the different class samples is larger. Experiment on the NIST 2008 speaker recognition data set demonstrates that the Mahalanobis distance scoring using the distance metric learned by WPCML algorithm has better performance than cosine distance scoring. It proposes a new way to construct the training pairwise set according to the Euclidean distance, which can improve the performance obviously and is better than the state-of-the-art PLDA classifier.
关 键 词:说话人识别 马氏距离 距离度量学习 机器学习 模式识别
分 类 号:TP391.4[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.220.97.0