基于角度边界的二进制函数对比学习模型  

An Angular-Margin-Based Binary Function Contrastive Learning Framework

在线阅读下载全文

作  者:孙瑞锦 郭世泽 黎维 詹达之 王军 潘志松 SUN Ruijin;GUO Shize;LI Wei;ZHAN Dazhi;WANG Jun;PAN Zhisong(College of Command&Control Engineering,Army Engineering University of PLA,Nanjing 210007,China;National Computer Network and Information Security Management Center,Beijing 100029,China;Army Academy of Armored Forces,Beijing 100072,China;Unit 31306 of PLA,Chengdu 610036,China)

机构地区:[1]陆军工程大学指挥控制工程学院,江苏南京210007 [2]国家计算机网络与信息安全管理中心,北京100029 [3]陆军装甲兵学院,北京100072 [4]31306部队,四川成都610036

出  处:《陆军工程大学学报》2024年第4期42-50,共9页Journal of Army Engineering University of PLA

基  金:国家自然科学基金(62076251)。

摘  要:现有代码相似性检测模型主要关注编码器的构建,对深度学习的损失函数研究较少。针对二进制函数嵌入向量评估被忽略的问题,提出了一种基于角度边界的二进制代码对比学习模型(angular marginbased binary code contrastive learning framework,AngCLF)。通过优化对比学习的目标函数,提高了模型的准确性并加快了收敛速度。分析了模型产生效果的原因,并引入多个评估二进制代码向量空间的指标。通过实验验证了AngCLF的准确性,发现其在准确性上超越了包括jTrans模型在内的6个模型,并且收敛速度更快,对齐度和均匀性等指标也有明显优势。Existing code similarity detection models primarily focus on constructing encoders,with limited research on loss functions in deep learning.To address the overlooked issue of evaluating embedded binary function vectors,this paper proposes an angular-margin-based binary code contrastive learning framework(AngCLF).By optimizing the objective function of contrastive learning,the model's accuracy and convergence speed are enhanced.Besides,the study analyzes the reasons for the model's effectiveness and introduces multiple metrics for evaluating binary code vector spaces.The experimental results validate the accuracy of the AngCLF.The AngCLF surpasses six models including the jTrans model in accuracy,and has faster convergence speed and obvious advantages in alignment and uniformity metrics.

关 键 词:对比学习 角度边界 嵌入学习 二进制代码相似性检测 

分 类 号:TP309[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象