基于预训练模型的多示例语音内容分类

Multiple Instance Learning for Speech Content Classification with Pre-trained Model

作　　者：张建宜姚佳奇褚衍杰燕继坤梁杰 ZHANG Jianyi;YAO Jiaqi;CHU Yanjie;YAN Jikun;LIANG Jie(Information Engineering University,Zhengzhou 450001,China;National Key Laboratory of Science and Technology on Blind Signal Processing,Chengdu 610041,China)

机构地区：[1]信息工程大学,河南郑州450001 [2]盲信号处理国家级重点实验室,四川成都610041

出　　处：《信息工程大学学报》2022年第2期141-147,共7页Journal of Information Engineering University

基　　金：国家自然科学基金资助项目(61272041)。

摘　　要：语音内容分类主要用于对大批量信号进行自动处理,并基于用户的兴趣选择语音文件。据此提出了一种新的分类方法,在多示例学习框架下,使用无监督语音表示学习对大规模未标记数据进行预训练,得到用于提取语音深层表示的预训练模型,提取的语音表示作为下游分类器的输入。真实语音数据集上的实验结果表明,多示例学习在处理语音分类问题上具有优势,提出的方法能够提高分类的效果,在平均准确率指标上优于3种基线方法。Speech content classification is mainly used to automatically process signals and select files based on user interest.According to this,a new method is proposed.Under the multiple instance learning framework,unsupervised speech representation learning is utilized to pre-train a model for extracting deep speech representation as the input of downstream classifier with large-scale unlabeled data.Experimental results on real-world speech dataset indicate that multiple instance learning has an advantage in speech classification,and the proposed method can improve the classification performance and is superior to the three baseline methods in average precision metric.

关键词：语音内容分类多示例学习预训练模型无监督语音表示学习

分类号：TN912.3[电子电信—通信与信息系统]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于预训练模型的多示例语音内容分类

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于预训练模型的多示例语音内容分类

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索