检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]复旦大学计算机科学技术学院,上海200433 [2]同济大学计算机科学与技术系,上海201804
出 处:《计算机工程》2011年第21期46-48,共3页Computer Engineering
基 金:国家自然科学基金资助项目(60873040)
摘 要:传统的基于向量空间模型的软件缺陷分派方法,由于存在特征空间维度高、数据稀疏且包含噪音等问题,分派准确率较低。为此,提出一种基于隐含狄利克雷分配(LDA)主题模型的软件缺陷分派方法,将缺陷报告从原始的高维文本单词空间映射到低维语义主题空间,在新的低维主题空间上进行分派。实验结果表明,在使用SVM和KNN分类器时,该方法的分派准确率较高。In traditional Vector Space Model(VSM) based software bug triage,the high dimensionality feature space are sparse and noise containing.Inspired by these characteristics,this paper proposes a software bug triage method based on Latent Dirichlet Allocation(LDA) topic model.It maps the bug report to the topic space,and makes triage in the new low dimension topic space.Experimental results show that,the method works well on bug triaging,with SVM and KNN classifiers.
关 键 词:软件缺陷分派 隐含狄利克雷分配模型 马尔可夫链蒙特卡洛方法 吉布斯采样 文本分类 向量空间模型
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.23.61.205