检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]北京邮电大学计算机学院,北京100876 [2]北京石油化工学院计算机系,北京102600
出 处:《山西大学学报(自然科学版)》2015年第3期406-412,共7页Journal of Shanxi University(Natural Science Edition)
基 金:北京市自然科学基金(4142015);北京石油化工学院国家级大学生创新训练计划资助(No.2015J00093)
摘 要:技术越来越得到关注,文章设计了从多文档中生成摘要的方法。基于多种语义特征和语义相似度计算句子的重要性评分值,使用stack decoder算法利用多个堆栈生成摘要;基于分团问题的生成方式构建了句子的非相似性图,通过求解非相似图中有边的子集合顶点选取合适的句子。实验以DUC2004语料集为数据集,通过上述方法产生摘要,ROUGE评测指标达0.069 7,与已有方法相比在ROUGE值上有明显提高,并对归一化方法进行了讨论,探索了适用的归一化措施。Automatic summarization technology is getting more and more attention,so we designed methods for generating summarization from multi-document.First,the importance scores are computed based on various semantic features and a semantic similarity score.We use stack-decoder algorithm as a template and build on it to produce summaries.Second,summaries are generated based on the cliques found in the constructed graph.The graph is generated by building edges between sentences which talk about similar topics but not similar semantic.These approaches are used to generate summaries for the DUC 2004 dataset.ROUGE score is 0.069 7which has significant improvement comparable to present method.We also discussed different normalized methods and designed the suitable normalized function.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.38