中文网页自动摘要系统的研究  被引量:2

Research on Automatic Abstracting of Chinese Web Page

在线阅读下载全文

作  者:徐晓丹[1] 

机构地区:[1]浙江师范大学信息科学与工程学院,浙江金华321004

出  处:《计算机与现代化》2006年第9期120-122,126,共4页Computer and Modernization

摘  要:自动摘要是自然语言处理中的一个重要但又困难的分支,在Web信息检索中起着重要作用。文章采用拟人思维,提出了一种篇章结构分析和统计相结合的自动摘要方法,并实现了一个中文网页自动摘要实验系统。该方法首先对文本进行篇章结构分析,得到段落的位置信息和各级小标题信息;然后综合这些结构信息使用统计方法和启发式规则来提取文档的关键词、关键句,生成文档的摘要。在实验评估中,该方法取得了令人满意的摘要质量和速度。Automatic abstracting is a practical and difficult branch in natural language processing, which becomes an important problem in domains such as Intemet information retrieval. This paper describes an automatic abstract system to process Chinese Web page, which is mainly based on text structure. The method provided in this paper is to analyze the text structure firstly, obtain the positional information of the paragraph and all levels of subtitles information, then uses statistical methods and the heuristic rule to extract key words and key sentences, and finally creates the abstract. Experiments show that this method can generate abstract effectively and efficiently.

关 键 词:自动摘要 中文网页 篇章结构 信息检索 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象