检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:杨涛 解庆 刘永坚[1] 刘平峰[2] YANG Tao;XIE Qing;LIU Yongjian;LIU Pingfeng(School of Computer Science and Technology,Wuhan University of Technology,Wuhan 430070,China;School of Economics,Wuhan University of Technology,Wuhan 430070,China)
机构地区:[1]武汉理工大学计算机科学与技术学院,武汉430070 [2]武汉理工大学经济学院,武汉430070
出 处:《计算机工程与应用》2022年第20期165-173,共9页Computer Engineering and Applications
基 金:湖北省自然科学基金(2018CFB564);中央高校基本科研业务经费(WUT:2020III008GX)。
摘 要:长文本摘要生成一直是自动摘要领域的难题。现有方法在处理长文本的过程中,存在准确率低、冗余等问题。鉴于主题模型在多文档摘要中的突出表现,将其引入到长文本摘要任务中。另外,目前单一的抽取式或生成式方法都无法应对长文本的复杂情况。结合两种摘要方法,提出了一种针对长文本的基于主题感知的抽取式与生成式结合的混合摘要模型。并在TTNews和CNN/Daily Mail数据集上验证了模型的有效性,该模型生成摘要ROUGE分数与同类型模型相比提升了1~2个百分点,生成了可读性更高的摘要。Summarization generation of long text is always a difficult problem in the field of automatic summarization.The existing methods have some problems such as low accuracy and redundancy in the process of processing long text.In view of the outstanding performance of the topic model in multi-document summarization,it is introduced into the long text summarization task.In addition,the current single extractive or abstractive method can not deal with the complex situ-ation of long text.It proposes a hybrid summarization model for long text based on topic aware,which combines extrac-tive and abstractive methods.The validity of the model is verified on TTNews and CNN/Daily Mail datasets.The ROUGE score of the model is 1 to 2 percentage points higher than that of the same type of model,resulting in a more readable summary.
分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229