检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王希 王君堡 边巴旺堆 WANG Xi;WANG Junbao;BIANBA Wangdui
机构地区:[1]西藏大学信息科学技术学院,西藏拉萨850000 [2]西藏大学信息技术学院国家级实验教学示范中心,西藏拉萨850000
出 处:《信息技术与信息化》2022年第11期202-206,共5页Information Technology and Informatization
基 金:西藏自治区高原通信科研创新团队(No.XZ2017ZR G-10);西藏大学研究生高水平人才培养计划项目(2020-GSP-S168)。
摘 要:语音情感识别(speech emotion recognition,SER)是人机交互中的热点研究技术,但基于藏语的SER研究少有学者涉足。在构建了一个五千条藏语拉萨方言的语音情感语料库TSEC5000的基础上,将卷积神经网络(convolutional neural network,CNN)用于实现藏语语音情感的识别,并通过改变CNN的层数来改进说话人相关、说话人无关的SER性能。实验结果表明,对于藏语说话人相关的SER在4层卷积网络上获得89%的识别率,基于TSEC5000说话人无关SER在5层网络上获得最好的识别率为76%。
分 类 号:H214[语言文字—少数民族语言] TN912.34[电子电信—通信与信息系统] TP183[电子电信—信息与通信工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222