利用信息检索和概率有限自动机的程序理解

Program comprehension using information retrieval and probabilistic finite-state automata

作　　者：陈华[1] 王灿[1] 陈纯[1] 唐文彬[2] 钱剑飞[3]

机构地区：[1]浙江大学计算机科学与技术学院,浙江杭州310027 [2]中国计量学院信息分院,浙江杭州310018 [3]上海理工大学计算机工程学院,上海200093

出　　处：《浙江大学学报（工学版）》2008年第12期2108-2111,2132,共5页Journal of Zhejiang University：Engineering Science

基　　金：国家自然科学基金资助项目(60573176);国家“973”重点基础研究发展规划资助项目(2007CB310900);浙江省重大科技专项资助项目(2006C11208);国家发改委高技术产业化资助项目(发改办高技【2006】2076号)

摘　　要：为提高基于信息检索的程序理解方法的准确性,提出了一种结合信息检索和概率状态机的两阶段程序理解方法.在该方法中使用概率有限自动机(probabilistic finite-state automata,PFA)解决了信息检索结果在程序理解中的不确定性,同时采用信息检索构建了多个简单的PFA,而不是单个复杂的PFA,提高了PFA分析的伸缩性.训练阶段先采用隐式语义分析对源代码进行聚类,然后在聚类结果上生成PFA.在识别阶段以词法处理后的程序作为检索项在程序模板库中进行信息检索,取检索结果中的最相关的n项作为候选模板,由候选模板对应得到相应的PFA,通过分析找到最大概率的PFA,完成对源码内容的语义标注.To improve the accuracy of information retrieval （IR） based program comprehension method, a new two stages method was proposed, which consists of IR stage and probabilistic finite-state automata （PFA） recognition stage. This method uses, PFAs to address the problem of imprecise in applying IR in program comprehension directly. Meanwhile, applying IR makes it possible to construct many simple PFAs rather than a big complex one to greatly improve the scalability of recognition. PFAs are learned from clusters generated by latent semantic analysis （LSA） in training state. In recognition state, source code segment is processed in lexical, and then it is used as an IR query to retrieve n candidate plans. After that, the corresponding PFAs of the plans are found, and the PFA with maximum probability is chosen. Finally, the code segment is marked with the same semantic as the result PFA.

关键词：程序理解概率有限自动机信息检索软件工程

分类号：TP311.53[自动化与计算机技术—计算机软件与理论]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

利用信息检索和概率有限自动机的程序理解

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

利用信息检索和概率有限自动机的程序理解

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索