一种基于文章主题和内容的自动摘要方法  被引量:12

Automatic Text Summarization Based on Topic and Content

在线阅读下载全文

作  者:陈燕敏[1] 王晓龙[1] 刘远超[1] 楼喜中[1] 

机构地区:[1]哈尔滨工业大学计算机科学与技术系,黑龙江哈尔滨150001

出  处:《计算机工程与应用》2004年第33期11-14,共4页Computer Engineering and Applications

基  金:国家自然科学基金(编号:60373100);国家863高技术研究发展计划项目基金(编号:2002AA117010-09)

摘  要:文章介绍了一种新的使用自然语言处理技术的自动系统。通过融合基于内容的方法和基于主题的方法,将主题与内容相结合,生成具有良好连贯性和流畅性的。该方法首先对主题词进行分析,动态地处理具有抽象标题和具体标题的文档;然后采用词汇、语法、语义分析等自然语言处理技术,对文章的文本内容进行深入分析;再根据线性加权融合两种分析得到的结果,生成;最后采用指代消解技术使生成的更连贯流畅。与仅基于内容的自动文摘系统相比较,评测结果显示,该系统生成的质量有明显提高。A new system using Natural Language Processing techniques is proposed.It processes documents not only based on content of original texts by analyzing its structure,but also based on topics of summaries,which are determined by user or text title.The method first analyzes subjective words and processes the document with abstract title or actual title separately;then a method based on content is adopted by integrated many kinds of NLP technologies;the results produced by above two methods are fused to generate the summary;the anaphora resolution technology is applied to improve the fluency of the summary last.Evaluation results show that quality summaries are produced from arbitrary Chinese text.The proposed system is compared to system based on content and it is shown that it produces either comparable or better summaries overall.

关 键 词:自动文摘 自然语言处理 主题分析 内容分析 融合 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象