基于谱聚类的多文档摘要新方法  被引量:4

Novel Multi-document Summarization Method Based on Spectral Clustering

在线阅读下载全文

作  者:林立[1] 胡侠[2] 朱俊彦[1] 

机构地区:[1]浙江大学计算机科学与技术学院,杭州310027 [2]杭州市科技信息研究院,杭州310001

出  处:《计算机工程》2010年第22期64-65,68,共3页Computer Engineering

基  金:残疾人信息无障碍服务关键技术及信息资源支撑基金资助项目(2008BAH26B02)

摘  要:提出一种基于谱聚类的多文档摘要方法。在将文档中主题相关的句子进行聚类的基础上,同时考虑不同主题类别的重要性,综合句子位置、长度等因素以得到句子的重要性得分。根据重要性从高到低抽取满足字数要求的句子作为最终摘要。实验结果表明,该方法相较于传统摘要方法有更好的性能,能够有效地提高摘要的质量。This paper proposes a multi-document summarization method based on spectral clustering. Based on clustering topic-relevant sentences in the documents together, this method creatively takes the importance of each class into consideration, along with sentence position, length and other factors to obtain the score of importance of the sentences. The sentences are sorted according to the score and extracted that meet the requirement of number of words as the summarization. Experimental results show that this method performs better than traditional methods and can improve the quality of summarization effectively.

关 键 词:多文档摘要 谱聚类 信息检索 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象