基于GAN和中文词汇网的文本摘要技术  被引量:5

GAN and Chinese WordNet Based Text Summarization Technology

在线阅读下载全文

作  者:刘晓影 王淮 乌吉斯古愣 LIU Xiao-ying;WANG Huai;WU Jisiguleng(Network Security Group,North China Institute of Computing Technology,Beijing 100083,China)

机构地区:[1]华北计算技术研究所网络安全工作组,北京100083

出  处:《计算机科学》2022年第12期301-304,共4页Computer Science

基  金:国家重点研发计划(2018YFC0831200)。

摘  要:随着神经网络技术的广泛应用,文本摘要技术吸引了越来越多科研人员的注意。由于生成式对抗网络(GANs)具有提取文本特征或学习整个样本的分布并以此产生相关样本点的能力,因此正逐步取代传统基于序列到序列(Seq2seq)的模型,被用于提取文本摘要。利用生成式对抗网络的特点,将其用于生成式的文本摘要任务。提出的生成式对抗模型由3部分组成:一个生成器,将输入的句子编码为更短的文本表示向量;一个可读性判别器,强制生成器生成高可读性的文本摘要;以及一个相似性判别器,作用于生成器,抑制其输出的文本摘要与输入的摘要之间的不相关性。此外,在相似性判别器中,引用中文的WordNet作为外部知识库来增强判别器的作用。生成器使用策略梯度算法进行优化,将问题转化为强化学习。实验结果表明,所提模型得到了较高的ROUGE评测分数。Since the introduction of neural networks, text summarization techniques continue to attract the attention of resear-chers.Similarly, generative adversarial networks(GANs)can be used for text summarization because they can generate text features or learn the distribution of the entire sample and produce correlated sample points.In this paper, we exploit the features of generative adversarial networks(GANs)and use them for abstractive text summarization tasks.The proposed generative adversa-rial model has three components: a generator, which encodes the input sentences into shorter representations;a readability discriminator, which forces the generator to create comprehensible summaries;and a similarity discriminator, which acts on the generator to curb the discorrelation between the outputted text summarization and the inputted text summarization.In addition, Chinese WordNet is used as an external knowledge base in the similarity discriminator to enhance the discriminator.The generator is optimized using policy gradient algorithm, converting the problem into reinforcement learning.Experimental results show that the proposed model gets high ROUGE evaluation scores.

关 键 词:文本摘要 生成式对抗网络 WORDNET 强化学习 自然语言处理 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象