融合句义特征的多文档自动摘要算法研究被引量：3

Research on Multi-Document Summarization Merging the Sentential Semantic Features

作　　者：罗森林[1] 白建敏[1] 潘丽敏[1] 韩磊[1] 孟强[1] LUO Shen-lin BAI Jian-min PAN Li-min HAN Lei MENG Qiang(School of Information and Electronics, Beijing Institute of Technology, Beijing 100081, China)

机构地区：[1]北京理工大学信息与电子学院,北京100081

出　　处：《北京理工大学学报》2016年第10期1059-1064,共6页Transactions of Beijing Institute of Technology

基　　金：国家"二四二"资助项目(2005C48);北京理工大学科技创新计划重大项目培育专项资助项目(2011CX01015)

摘　　要：研究是自然语言处理领域的关键问题之一,为使抽取的摘要更能体现多文档主题,本文在子主题划分的基础上,提出了一种融合句义特征的句子优化选择方法.该方法基于句义结构模型,提取句义结构中的话题、谓词等特征,并融合统计特征构造特征向量计算句子权重,最后采用综合加权选取法和最大边缘相关相结合的方法抽取摘要.选取不同主题的文本集进行实验和评价,在摘要压缩比为15%情况下,系统摘要平均准确率达到66.7%,平均召回率达到65.5%.实验结果表明句义特征的引入可以有效提升多文档摘要的效果.Multi-document summarization （MDS） is one of the key issues in the field of natural language processing. In order to extract compendious sentences to reflect more accurate theme of the multi-document, a new method was proposed to retrieve terse sentences. At first, some sentential semantic features （SSF）, for example topic and predicate, were extracted based on a sentential semantic model （SSM）. Then the sentence weight was calculated by building feature vector merging statistical features and SSF. Finally, sentences were extracted according to the feature weighting and maximal marginal relevance （MMR）. A set of experiment show that the new method is effective, the average precision rate of summary can reach 66. 7%, and the average recall rate can reach 65.5% when the compression ratio of summary is 15%. The results of experiments show that the SSF are effective on upgrading the affection of MDS.

关键词：多文档自动摘要句义结构模型句义特征自然语言处理

分类号：TP391[自动化与计算机技术—计算机应用技术] TP18[自动化与计算机技术—计算机科学与技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

融合句义特征的多文档自动摘要算法研究被引量：3

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

融合句义特征的多文档自动摘要算法研究 被引量：3

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

融合句义特征的多文档自动摘要算法研究被引量：3