位置结构导向的多模态代码摘要生成方法  

A positional structure-oriented multimodal code summarizationgeneration approach

在线阅读下载全文

作  者:张学君 侯霞[1] ZHANG Xuejun;HOU Xia(Computer School,Beijing Information Science&Technology University,Beijing 100101,China)

机构地区:[1]北京信息科技大学计算机学院,北京100101

出  处:《北京信息科技大学学报(自然科学版)》2024年第2期43-49,共7页Journal of Beijing Information Science and Technology University

基  金:北京市自然科学基金青年项目(4224090)。

摘  要:针对软件维护中的自动代码摘要任务,提出了一种创新的模型,旨在解决现有方法在保留源代码语义结构信息方面的不足。该模型采用图神经网络和Transformer技术,以更全面地捕捉代码的语义信息和结构信息。此外,采用字节对编码算法来处理未登录词问题,并通过四元组的形式保留抽象语法树的结构信息。这样的组合使得模型在处理源代码时不仅能够全面地捕捉代码的语义特征,还能够准确地学习到代码的语法结构。在真实Java数据集上的实验结果表明,该模型在BLEU、METEOR和ROUGE指标上均优于基线模型,从而验证了其在生成更准确代码摘要方面的有效性。syntax tree structure information was preserved using quadruples.This combination enabled the model to not only comprehensively capture the semantic features of source code but also accurately learn its syntactic structure.Experimental results on a real-world Java dataset demonstrate that this model outperforms baseline models in terms of BLEU,METEOR and ROUGE metrics,validating its effectiveness in generating more accurate code summarization.

关 键 词:自动代码摘要 字节对编码 抽象语法树 TRANSFORMER 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象