检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《计算机应用研究》2013年第11期3299-3301,共3页Application Research of Computers
基 金:国家自然科学基金资助项目(61170105);江苏省公共工程审计重点实验室2012年开放课题(20201201211)
摘 要:针对多文档文摘生成过程中话题容易中断和文摘句子语义出现不连贯这两个研究难点,分析了潜在语义分析聚类算法在句子排序中的应用,以期提高文摘的生成质量。先采用潜在语义分析聚类算法将文摘句子聚类,从而形成话题集,以达到解决话题中断的目的。通过计算文档的文摘展现力,挑选出文摘展现力最大的文档作为模板,然后根据模板对文摘句子进行两趟排序。实验结果表明,提出的算法是有效的,该算法能够提高文摘的可读性。In order to improve the performance of summarization, this paper researched on application of latent semantic analysis clustering algorithm in summary sentence ordering. It adopted latent semantic analysis clustering algorithm to cluster summary sentences into topic sets to make the sentences within the same topic without be interrupted. It selected the ordering template by the summary representation of document, and ordered topic sets by the relational position in the template, ordered the sentences in the same topic set by the position in template. The experimental result shows that the proposed method is effective. It improves the readability of the summary.
分 类 号:TP301[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15