检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:徐晓丹[1]
机构地区:[1]浙江师范大学信息科学与工程学院,浙江金华321004
出 处:《计算机与现代化》2006年第9期120-122,126,共4页Computer and Modernization
摘 要:自动摘要是自然语言处理中的一个重要但又困难的分支,在Web信息检索中起着重要作用。文章采用拟人思维,提出了一种篇章结构分析和统计相结合的自动摘要方法,并实现了一个中文网页自动摘要实验系统。该方法首先对文本进行篇章结构分析,得到段落的位置信息和各级小标题信息;然后综合这些结构信息使用统计方法和启发式规则来提取文档的关键词、关键句,生成文档的摘要。在实验评估中,该方法取得了令人满意的摘要质量和速度。Automatic abstracting is a practical and difficult branch in natural language processing, which becomes an important problem in domains such as Intemet information retrieval. This paper describes an automatic abstract system to process Chinese Web page, which is mainly based on text structure. The method provided in this paper is to analyze the text structure firstly, obtain the positional information of the paragraph and all levels of subtitles information, then uses statistical methods and the heuristic rule to extract key words and key sentences, and finally creates the abstract. Experiments show that this method can generate abstract effectively and efficiently.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222