中文网页自动摘要系统的研究被引量：2

Research on Automatic Abstracting of Chinese Web Page

作　　者：徐晓丹[1]

出　　处：《计算机与现代化》2006年第9期120-122,126,共4页Computer and Modernization

摘　　要：自动摘要是自然语言处理中的一个重要但又困难的分支,在Web信息检索中起着重要作用。文章采用拟人思维,提出了一种篇章结构分析和统计相结合的自动摘要方法,并实现了一个中文网页自动摘要实验系统。该方法首先对文本进行篇章结构分析,得到段落的位置信息和各级小标题信息;然后综合这些结构信息使用统计方法和启发式规则来提取文档的关键词、关键句,生成文档的摘要。在实验评估中,该方法取得了令人满意的摘要质量和速度。Automatic abstracting is a practical and difficult branch in natural language processing, which becomes an important problem in domains such as Intemet information retrieval. This paper describes an automatic abstract system to process Chinese Web page, which is mainly based on text structure. The method provided in this paper is to analyze the text structure firstly, obtain the positional information of the paragraph and all levels of subtitles information, then uses statistical methods and the heuristic rule to extract key words and key sentences, and finally creates the abstract. Experiments show that this method can generate abstract effectively and efficiently.

关键词：自动摘要中文网页篇章结构信息检索

分类号：TP391[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

中文网页自动摘要系统的研究被引量：2

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

中文网页自动摘要系统的研究 被引量：2

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

中文网页自动摘要系统的研究被引量：2