检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张培颖[1]
机构地区:[1]中国石油大学(华东)计算机与通信工程学院,山东257061
出 处:《微计算机应用》2009年第7期14-18,共5页Microcomputer Applications
基 金:中国石油大学(华东)计算机与通信工程学院青年教师创新基金资助(08120907)
摘 要:自动摘要是解决网络信息过载问题的关键技术之一。在对文本中句子的特征和句子之间的语义距离分析的基础上,提出了一种基于句子特征和语义距离的自动文本摘要算法。首先计算文档中句子的各个特征权重,在此基础上决定句子的权重;然后,通过句子之间的语义距离计算,修改句子的权重,据此进行排序,权重大的作为文本的主题句;最后,对文摘句进行平滑处理,生成文字流畅的文本摘要。实验表明,该算法在不同的压缩率下生成的摘要接近于人工摘要,具有较好的性能。The technology of automatic text summarization provide a solution to the information overload problem. This paper proposes an effective method to extract salient sentences using the sentence features and semantic distance. The proposed method combines three steps: the first ste Pis to calculate the sentence feature weight based on its features, the second ste Pis to modify the sentence weight through the semantic computation among sentences, the last ste Pis to choose the sentence which own the highest weight and deal with the summary smoothly. The experimental results on web pages show that our proposed method can make high quality summarization in different compression ratio, has promising performance.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249