检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]合肥工业大学计算机与信息学院,安徽合肥230009 [2]伊利诺伊大学香槟分校电子计算机工程系,伊利诺伊州61801
出 处:《中国科学技术大学学报》2010年第5期486-490,共5页JUSTC
基 金:国家自然科学基金(60672120)资助
摘 要:首先描述了智能环境下一种基于语音和人脸图像的双模态的身份辨识系统;然后在基于语音的说话人辨识中采用改进的基于语音段的高斯混合模型,在基于人脸的身份辨识中利用K近邻法对整个视频序列而非单个静止图做判决;最后在评分层通过对双模态输出的评分进行规整和加权组合实现融合.实验表明,音视频双模态融合能有效提高身份辨识系统的正确率.A bimodal person identification system is described by combining speech and 2D face images in a smart environment. The audio only system was based on a newly proposed model-segment-based Gaussian Mixture Model. The visual only system was a face recognition module based on K-nearest neighbors classifier. Finally the audio-visual system fused the individual modalities at the scoring level through score normalization, modality weighting and combination. Experimental results indicate the effectiveness of the speaker modeling methods and the fusion scheme.
分 类 号:TN912.34[电子电信—通信与信息系统]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.16.107.122