检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张琪 范永胜 ZHANG Qi;FAN Yongsheng(School of Computer and Information Science,Chongqing Normal University,Chongqing 401331,China)
机构地区:[1]重庆师范大学计算机与信息科学学院,重庆401331
出 处:《电子科技》2023年第12期72-78,共7页Electronic Science and Technology
基 金:教育部人文社会科学研究项目(18XJC880002);重庆市教育委员会科技项目(KJQN201800539);重庆师范大学(人才引进/博士启动)基金(17XCB008)。
摘 要:生成任务旨在解决用户在阅读新闻时无法快速把握内容重点而造成的时间损耗和阅读疲劳等问题。目前面向中文的文本摘要模型效果较佳的是T5 PEGASUS模型,但针对该模型的研究较少。文中针对T5 PEGASUS模型的中文分词方面进行改进,使用更适用于新闻领域的Pkuseg分词方法进行处理,并在NLPCC2017、LCSTS、SogouCS这3种新闻长度不同的公开数据集上验证其有效性。研究发现Pkuseg分词方法更适合T5 PEGASUS模型,模型生成摘要的ROUGE(Recall-Oriented Understudy for Gisting Evaluation)值与新闻文本长度成正相关,训练集损失值和损失值下降速度与新闻文本长度成负相关,在面对少量训练集时能得到较高的ROUGE分数,因此该模型具有较强的小样本学习能力。The task of generating news text summarizations aims to solve the problems of wasting time and reading fatigue caused by users'inability to quickly grasp the key points of the content when reading news.At present,the best text summarization model for Chinese is the T5 PEGASUS model,but there are few researches on this model.In this study,the Chinese word segmentation of the T5 PEGASUS model is improved,and the Pkuseg word segmentation method,which is more suitable for news field,is used for processing,and its effectiveness is verified on three public datasets with different news lengths:NLPCC2017,LCSTS and SogouCS.It is found that the Pkuseg method is more suitable for the T5 PEGASUS model.The ROUGE value of T5 Pegasus model generated summaries is positively correlated with the length of news text,and the loss value of training set and the decline speed of loss value are negatively correlated with the length of news text.In the face of a small number of training sets,the model can get a high ROUGE score,so the model has a strong few-shot learning ability.
关 键 词:文本摘要生成 生成式模型 T5 PEGASUS 新闻文本 中文分词 Pkuseg 小样本学习 ROUGE
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15