检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:焦利颖 郭岩[2] 刘悦[2] 俞晓明[2] 程学旗[2] JIAO Liying;GUO Yan;LIU Yue;YU Xiaoming;CHENG Xueqi(University of Chinese Academy of Sciences,Beijing 100049,China;CAS Key Laboratory of Network Data Science and Tech no logy.In stitute of Computing Technology,Chinese Academy of Sciences,Beijing 100190,China)
机构地区:[1]中国科学院大学,北京100049 [2]中国科学院计算技术研究所中国科学院网络数据科学与技术重点实验室,北京100190
出 处:《中文信息学报》2021年第1期64-71,共8页Journal of Chinese Information Processing
基 金:国家重点研发计划(2017YFB0803302)。
摘 要:中文单文档摘要是把一篇文档压缩成一个更短描述的过程。随着互联网数据量的增长,文档压缩技术对文本分析、数据浏览等有着重大的应用价值。但在基于序列模型的单文档单句摘要生成即标题生成领域中仍然存在数据使用率不高的问题。该文提出基于关键信息指导的标题生成算法。算法中的关键信息除了主流方法中使用的新闻首段句子之外,还包括新闻后续内容中有实质信息的句子,以及新闻中的重点词语。该算法将这些关键信息作为序列模型的输入,指导其生成标题,使得生成的标题能够覆盖更多的新闻信息。实验表明,在基于序列模型生成标题时,使用关键信息能够提升新闻标题生成的效果。Single document summarization is a process of compressing a document into a short description. For this purpose, this paper proposes a headline generation algorithm for a single document guided by the key information. In addition to the first paragraph of the news used in the mainstream method, the key information in the algorithm includes sentences with substantive information in the following contents, as well as key words in the news. The algorithm uses the key information as input of the sequence model to generate a title so that the generated headline can cover more news information. Experiments show that using key information can improve the effect of news headline generation based on sequence models.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.49