基于时间戳的多文档自动文摘  被引量:3

Automatic Multidocument Summarization Based on Time Stamp

在线阅读下载全文

作  者:索红光[1] 梁玉环[2] 刘玉树[1] 

机构地区:[1]北京理工大学计算机科学与技术学院,北京100081 [2]中国石油大学计算机与通信工程学院,东营257061

出  处:《计算机工程》2007年第16期164-165,共2页Computer Engineering

摘  要:网站的新闻专题往往包含大量的网页,多文档自动文摘可以帮助人们从中快速获取主要信息。该文提出了利用时间戳改善文摘句子抽取质量和排序的方法。介绍了句子抽取方法、句子重要度计算、句子冗余减小方法。实验表明,形成的文摘性能良好,可以应用于实际系统中。News special topic in Web site has plentiful pages. People can get main information rapidly by automatic multidocument summarization. A method which uses time stamp to improve sentence extraction quality is presented. The method of news sentence extraction, sentence importance calculation, and redundancy reducing is introduced. Experimental results show that summarization is good enough for practical application.

关 键 词:多文档自动文摘 时间戳 信息抽取 句子相似度 

分 类 号:TP31[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象