检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张灵[1] 郭林威 ZHANG Ling;GUO Lin-wei(School of Computer Science,Guangdong University of Technology,Guangzhou 510000,China)
出 处:《沈阳工业大学学报》2023年第3期313-318,共6页Journal of Shenyang University of Technology
基 金:广东省自然科学基金项目(2021A1515012233)。
摘 要:针对目前知识蒸馏忽略特征图全局统计信息的问题,提出利用离散余弦变换(DCT)频域释义的全局统计特征知识,并对各类别的频域特征使用Logistic分类器进行二分类,提取类间差异性信息.利用元学习算法(MPL)对教师模型参数进行更新,使教师模型能动态调整所传递的频域特征.实验模型在CIFAR-10,CIFAR-100以及ImageNet 2012数据集上有0.12%~0.16%的精度提升,结果表明,频域特征与类间相似性信息为学生模型的训练提供更多有用的知识,且两模型的知识交互更有利于教师的知识迁移.Aiming at the problem that knowledge distillation nowadays tends to ignore global statistical information about intermediate layers,the global statistical knowledge of DCT frequency domain interpretation was proposed.The logistic classifier was also utilized for binary classification in terms of frequency domain features for each class,to extract information on inter-class differences.In addition,by referring to parameter update algorithm of teacher model(Meta Pseudo Labels,MPL),the as-proposed models can dynamically adjust the frequency domain features.The experimental models in CIFAR-10,CIFAR-100 and ImageNet 2012 data sets witness improvements of their accuracy rates ranging from 0.12%to 0.16%.The results demonstrate that frequency domain features and inter-class differences can make the training of student models more instructive while making knowledge interaction between both models more favorable to knowledge transfer by teachers.
关 键 词:知识蒸馏 元学习 离散余弦变换 自监督 中间特征层 Logistic分类器 全局统计特征知识 类间差异性信息
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.133.141.1