检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:孙瑞锦 郭世泽 黎维 詹达之 王军 潘志松 SUN Ruijin;GUO Shize;LI Wei;ZHAN Dazhi;WANG Jun;PAN Zhisong(College of Command&Control Engineering,Army Engineering University of PLA,Nanjing 210007,China;National Computer Network and Information Security Management Center,Beijing 100029,China;Army Academy of Armored Forces,Beijing 100072,China;Unit 31306 of PLA,Chengdu 610036,China)
机构地区:[1]陆军工程大学指挥控制工程学院,江苏南京210007 [2]国家计算机网络与信息安全管理中心,北京100029 [3]陆军装甲兵学院,北京100072 [4]31306部队,四川成都610036
出 处:《陆军工程大学学报》2024年第4期42-50,共9页Journal of Army Engineering University of PLA
基 金:国家自然科学基金(62076251)。
摘 要:现有代码相似性检测模型主要关注编码器的构建,对深度学习的损失函数研究较少。针对二进制函数嵌入向量评估被忽略的问题,提出了一种基于角度边界的二进制代码对比学习模型(angular marginbased binary code contrastive learning framework,AngCLF)。通过优化对比学习的目标函数,提高了模型的准确性并加快了收敛速度。分析了模型产生效果的原因,并引入多个评估二进制代码向量空间的指标。通过实验验证了AngCLF的准确性,发现其在准确性上超越了包括jTrans模型在内的6个模型,并且收敛速度更快,对齐度和均匀性等指标也有明显优势。Existing code similarity detection models primarily focus on constructing encoders,with limited research on loss functions in deep learning.To address the overlooked issue of evaluating embedded binary function vectors,this paper proposes an angular-margin-based binary code contrastive learning framework(AngCLF).By optimizing the objective function of contrastive learning,the model's accuracy and convergence speed are enhanced.Besides,the study analyzes the reasons for the model's effectiveness and introduces multiple metrics for evaluating binary code vector spaces.The experimental results validate the accuracy of the AngCLF.The AngCLF surpasses six models including the jTrans model in accuracy,and has faster convergence speed and obvious advantages in alignment and uniformity metrics.
关 键 词:对比学习 角度边界 嵌入学习 二进制代码相似性检测
分 类 号:TP309[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.217.166.126