局部加全局视角遮挡人脸表情识别方法  被引量:1

Local and Global View Occlusion Facial Expression Recognition Method

在线阅读下载全文

作  者:南亚会 华庆一[1] NAN Yahui;HUA Qingyi(College of Information Science and Technology,Northwest University,Xi’an 710127,China;Department of Computer Science and Technology,Lyuliang University,Lyuliang,Shanxi 033001,China)

机构地区:[1]西北大学信息科学与技术学院,西安710127 [2]吕梁学院计算机科学与技术系,山西吕梁033001

出  处:《计算机工程与应用》2024年第13期180-189,共10页Computer Engineering and Applications

基  金:山西省教育厅研究生教育教学改革课题(2022YJJG310);山西省教育厅高等学校教学改革创新项目(J20221157);吕梁市重点研发项目(2023GXYF20,2022GXYF17,2022GXYF16);山西省基础研究计划(自由探索类)项目(202303021212504)。

摘  要:实际场景中各种遮挡增加了表情识别难度。为此,提出一种滑块局部加权卷积注意力和全局注意力池化的视觉Transformer结合的方法来解决遮挡问题。利用主干网络提取表情特征图,将表情特征图裁剪成多个区域块,利用局部Patch注意力单元通过自适应计算局部特征的注意力权重来感知被遮挡的区域,提取表情局部特征。同时,表情特征图转换成Patch块,通过Patch级和Token级注意力池化的视觉Transformer,从全局角度捕获Patch块之间的相互作用和相关性。引导模型强调最具区别性的特征,而忽略遮挡减少不相关特征的影响。在三个表情数据集及其遮挡子集和一个遮挡数据集上进行实验,结果表明所提模型在遮挡表情识别上优于现有方法。Various occlusions in the actual scene increase the difficulty of expression recognition.This paper proposes a method consisting of a local weighted convolutional attention slider and a global attention pooling vision Transformer to address the occlusion problem.It extracts facial feature maps using a backbone convolutional neural network,crops the facial feature map into multiple regions,and uses a local Patch attention unit to perceive occluded regions by adaptively calculating the attention weights of local features,extracting local facial expression features.The facial feature map is converted into Patch blocks,and the vision Transformer with Patch-level attention pooling and Token-level attention pooling is used to capture the interactions and correlations between Patch blocks from a global perspective.The guidance model emphasizes the most distinctive features while ignoring occlusion to reduce the impact of irrelevant features.Experiments on three expression datasets,their occlusion subsets,and an occlusion dataset show that the proposed model outperforms existing methods in occlusion expression recognition.

关 键 词:遮挡人脸表情识别 滑块局部卷积注意力 Patch注意力池化 Token注意力池化 vision Transformer 

分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象