基于规则和统计的中文自动文摘系统  被引量:21

Research on Automatic Summarization Based on Rules and Statistics for Chinese Texts

在线阅读下载全文

作  者:傅间莲[1] 陈群秀[1] 

机构地区:[1]清华大学计算机系智能技术与系统国家重点实验室,北京100084

出  处:《中文信息学报》2006年第5期10-16,共7页Journal of Chinese Information Processing

摘  要:自动文摘是自然语言处理领域里一个重要课题,本文在传统方法基础上提出了一种中文自动文摘的方法。在篇章结构分析里,我们提出了基于连续段落相似度的主题划分算法,使生成的文摘更具内容全面性与结构平衡性。同时结合了若干规则对生成的文摘初稿进行可读性加工处理,使最终生成的文摘更具可读性。最后提出了一种新的文摘评价方法(F-new-m easure)对系统进行测试。系统测试表明该方法在不同文摘压缩率时,评价值均较为稳定。As automatic summarization is an important research topic in the natural language processing, the paper presents an approach for Chinese text summarization on the basis of traditional methods, For text structure analysis, an algorithm is proposed for multi-topic text partitioning based on sequential paragraphic similarity, which can makes the abstract of the multi-topic article have more general content and more balanced structure, Futhermore, a series of rules are combined to enhance the readability of the output abstract. Finally, a new evaluation method is put forward. The primary test shows that its value is stable.

关 键 词:计算机应用 中文信息处理 自动文摘 向量空间模型 主题划分 可读性 评价 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象