检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:章芝青[1]
机构地区:[1]浙江大学计算机科学与技术学院,杭州310027
出 处:《计算机应用》2010年第6期1673-1675,共3页journal of Computer Applications
摘 要:单文档自动摘要的目的是在原始的文本中通过摘取、提炼主要信息,提供一篇简洁全面的摘要。自动摘要的主流方法是通过统计和机器学习的技术从文本中直接提取出句子,而单文档由于篇章有限,统计的方法无效。针对此问题,提出了基于语义的单文本自动摘要方法。该方法首先将文档划分为句子,然后计算每一对句子的语义相似度,通过运用改进型K-Medoids聚类算法将相似的句子归类,在每一类中选出最具代表性的句子,最后将句子组成文档摘要。实验结果表明,通过融合语义信息,该方法提高了摘要的质量。Single-document summarization goals to create a compressed summary while retaining the theme of the original document.Many approaches use statistics and machine learning techniques to extract sentences from a document.Because single document has limited information,the main approaches are of no effect.Therefore,a new single-document summarization framework based on semantics was proposed.First,the sentence-sentence similarity was calculated.After that modified K-Medoids clustering algorithm was used to cluster the sentences.Finally,the most informative sentence was chosen from each cluster to form the summary.The experimental results demonstrate the improvement of the summary quality by using semantics information.
关 键 词:语义 知网 改进型K-Medoids聚类
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15