短文本新闻标题生成方法  

Researchon Short Text News Title Generation Method

在线阅读下载全文

作  者:赵明 ZHAO Ming(Network Center,Fujian Longyan Xinluo District Education Bureau,Longyan 364099,China)

机构地区:[1]福建省龙岩市新罗区教育局网络中心,福建龙岩364099

出  处:《电子科技》2024年第9期87-94,共8页Electronic Science and Technology

基  金:国家重点研发计划(2022YFF0903404)。

摘  要:当今新闻具有文本短、发布频繁、时效性强等特点,一个媒体账号一天内发布数十条新闻。为大量新闻制定适用且有吸引力的标题已经成为媒体工作者的一项主要工作内容。媒体工作者需要一个自动生成短文本标题的系统来缓解工作压力。为解决该问题,文中提出了一种短文本新闻标题生成模型。该模型采用序列到序列结构,在编码器和解码器分别应用预训练语言模型和分层自注意力解码器。为了使生成标题包含原始新闻的关键信息,提出一种基于LCSTS数据集和Weibo4数据集的分阶段训练方法,并使模型分别从这两个数据集学习提取关键新闻信息和构建风格化表达,使模型生成标题能够准确表达新闻的核心内容从而吸引读者。Today's news has the characteristics of short text,frequent release,timeliness,etc.A media account releases dozens of news in a day.Developing suitable and attractive headlines for large volumes of news has become a major part of the work of media workers.Media workers need a system that automatically generates short text headlines to relieve their stress.To solve this problem,this study proposes a short text news title generation model.The model adopts sequence-to-sequence structure,using pre-trained language model and layered self-attention decoder in encoder and decoder respectively.In order to make the generated headlines contain the key information of the original news,a staged training method based on LCSTS data set and Weibo4 data set is proposed,and the model learns to extract the key news information and construct a stylized expression from the two data sets respectively,so that the generated headlines can accurately express the core content of the news and attract readers.

关 键 词:新闻标题生成 预训练语言模型 分层自注意力解码器 编码器 文本提取 文本生成 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象