基于卷积Token的Vision Transformer模型的人脸表情识别  

Face Expression Recognition with Vision Transformer Model Based on Convolutional Token

在线阅读下载全文

作  者:王静[1] 商钰 Wang Jing;Shang Yu(School of Computer Science and Engineering,North China Institute of Aerospace Engineering,Langfang 065000,China)

机构地区:[1]北华航天工业学院计算机学院,河北廊坊065000

出  处:《北华航天工业学院学报》2023年第5期8-10,共3页Journal of North China Institute of Aerospace Engineering

基  金:北华航天工业学院科研基金项目(ZD201808);北华航天工业学院研究生创新资助项目(YKY-2023-31);河北省高等学校科学技术研究项目(QN2021203)。

摘  要:人脸表情识别有着广泛的应用。本文使用基于卷积Token的Vision Transformer的混合模型实现表情识别。混合模型能够更好地捕捉人脸表情的局部特征以及局部特征之间的相关性。实验使用RafDB和Fer2013Plus数据集,并对比了ResNet、DenseNet、Swin Transformer和CVT模型的精度和分类混合矩阵分析在人脸表情识别中的表现。This study uses a hybrid model of Vision Transformer based on Convolutional Token to realize facial expression recognition.The hybrid model effectively captures local features of facial expressions and their global dependency.Experiments are conducted using the RafDB and Fer2013Plus datasets.It also analyzes the accuracy and classification confusion matrices of ResNet,DenseNet,Swin Transformer,and CVT models in these two datasets.

关 键 词:卷积Token Vision Transformer 混合模型 表情识别 混合矩阵 

分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象