检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:陈华[1] 王灿[1] 陈纯[1] 唐文彬[2] 钱剑飞[3]
机构地区:[1]浙江大学计算机科学与技术学院,浙江杭州310027 [2]中国计量学院信息分院,浙江杭州310018 [3]上海理工大学计算机工程学院,上海200093
出 处:《浙江大学学报(工学版)》2008年第12期2108-2111,2132,共5页Journal of Zhejiang University:Engineering Science
基 金:国家自然科学基金资助项目(60573176);国家“973”重点基础研究发展规划资助项目(2007CB310900);浙江省重大科技专项资助项目(2006C11208);国家发改委高技术产业化资助项目(发改办高技【2006】2076号)
摘 要:为提高基于信息检索的程序理解方法的准确性,提出了一种结合信息检索和概率状态机的两阶段程序理解方法.在该方法中使用概率有限自动机(probabilistic finite-state automata,PFA)解决了信息检索结果在程序理解中的不确定性,同时采用信息检索构建了多个简单的PFA,而不是单个复杂的PFA,提高了PFA分析的伸缩性.训练阶段先采用隐式语义分析对源代码进行聚类,然后在聚类结果上生成PFA.在识别阶段以词法处理后的程序作为检索项在程序模板库中进行信息检索,取检索结果中的最相关的n项作为候选模板,由候选模板对应得到相应的PFA,通过分析找到最大概率的PFA,完成对源码内容的语义标注.To improve the accuracy of information retrieval (IR) based program comprehension method, a new two stages method was proposed, which consists of IR stage and probabilistic finite-state automata (PFA) recognition stage. This method uses, PFAs to address the problem of imprecise in applying IR in program comprehension directly. Meanwhile, applying IR makes it possible to construct many simple PFAs rather than a big complex one to greatly improve the scalability of recognition. PFAs are learned from clusters generated by latent semantic analysis (LSA) in training state. In recognition state, source code segment is processed in lexical, and then it is used as an IR query to retrieve n candidate plans. After that, the corresponding PFAs of the plans are found, and the PFA with maximum probability is chosen. Finally, the code segment is marked with the same semantic as the result PFA.
分 类 号:TP311.53[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222