多文档文摘提取方法的研究被引量：4

Investigation of method for extracting multi-document abstracts

出　　处：《兰州理工大学学报》2007年第1期96-99,共4页Journal of Lanzhou University of Technology

基　　金：甘肃省自然科学基金(ZS022-A25-035);甘肃省教育厅科研基金(0416B-04)

摘　　要：在深入分析当前流行的自动文摘技术和方法的基础上,将语义方法融入统计算法,提出了一种基于统计的多文档文摘提取方法,描述了它的实现过程.该方法利用文档内和文档之间段落的语义相关性,实现了多文档文摘的自动生成.首先对文档进行分段实现信息分割,再利用聚类技术对文本段进行聚类实现信息合并,最后从类中抽取代表段产生摘要文本.实验结果表明,该方法是一个有效、实用的方法.Base on the analysis of currently prevalent techniques and methods of automatic abstracting thoroughly, a method for extracting multi-document abstracts was presented based on statistics, and its implementation process was described, also. By using semantic correlation among paragraphs in an article and that among articles, automatic generation of multi-document summary was implemented. First of all, texts were segmented into semantic paragraphs to implement information segmentation, and then, by using clustering algorithm, semantic paragraphs were merged into topic classes. Finally, representative paragraphs were extracted from classes to generate text summary and implement information condensation. Experimental results indicated that the method was effective and applicable in practice.

关键词：自动文摘文本分段语义段向量空间模型文本模型

分类号：TP391[自动化与计算机技术—计算机应用技术] TP18[自动化与计算机技术—计算机科学与技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

多文档文摘提取方法的研究被引量：4

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

多文档文摘提取方法的研究 被引量：4

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

多文档文摘提取方法的研究被引量：4