检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:程亚龙 梁军 邹雲宇 CHENG Yalong;LIANG Jun;ZOU Yunyu(School of Software,South China Normal University,Foshan 528225,China)
出 处:《软件导刊》2024年第11期181-186,共6页Software Guide
基 金:广东省基础与应用基础研究基金项目(2022A1515140110,2021A1515110673,2020B1515120089);佛山市高等教育高层次人才项目(2022)。
摘 要:针对实时手势检测需求,提出一种基于YOLOv5的手势识别算法。通过采用轻量级主干网络MobileNetV3替代YOLOv5s中的CSPNet-53,优化后的主干网络整合了深度可分离卷积与SE注意力机制,形成模型M_YOLO_N(Mo⁃bileNet_YOLOv5_NewIou)。与原始模型相比,M_YOLO_N的参数量减少了33%,计算复杂度(GFLOPs)降低了54%,在自制手势数据集上的mAP@0.5提升了2.4%。该模型不仅实现了轻量化,而且有效解决了实时检测问题。针对多尺度手势检测,保留SPPF模块,并引入归一化高斯瓦伦汀距离(NWD)技术,提出新的边界框损失函数NewIoU。在不增加参数的前提下,改进后的模型在多尺度手势检测中的置信度提升了20%。To meet the demand for real-time hand gesture detection,this paper presents a YOLOv5-based gesture recognition algorithm.By replacing CSPNet-53 in YOLOv5s with the lightweight MobileNetV3,the optimized backbone integrates depthwise separable convolutions and the SE attention mechanism,forming the M_YOLO_N model.Compared to the original,M_YOLO_N reduces parameters by 33%and decreas⁃es computational complexity by 54%.On a custom dataset,mAP@0.5 increased by 2.4%.This model achieves both lightweight design and re⁃al-time detection.For multi-scale detection,the SPPF module is retained,and the normalized Wasserstein distance(NWD)is introduced,proposes a new bounding box loss function NewIoU.Without increasing parameters,detection confidence improved by 20%.
关 键 词:YOLOv5 手势识别 深度可分离卷积 注意力机制
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.148.113.167