检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:席铁钧 段宗涛[1] 曹建荣 杨博 卜娜娜 刘悦霞 肖媛媛 XI Tiejun;DUAN Zongtao;CAO Jianrong;YANG Bo;BU Na’na;LIU Yuexia;XIAO Yuanyuan(School of Information Engineering,Chang’an University,Xi’an,Shaanxi 710018,China)
出 处:《中文信息学报》2024年第7期63-72,共10页Journal of Chinese Information Processing
基 金:陕西省重点研发计划项目(2019ZDLGY17-08);陕西省特支计划科技创新领军人才项目(TZ0336)。
摘 要:旨在从冗长复杂的舆情文本中,准确地生成简短摘要。在长文本涉法舆情摘要中,现有的自动文本摘要方法存在语义不连贯、关键信息丢失的问题。为此,该文提出了一种结合抽取式和生成式的混合式摘要方法。首先将长文本分成多个语义片段;其次采用无监督对比学习方法微调RoBERTa-wwm-ext模型进行语义片段的表征;然后使用膨胀门卷积神经网络抽取与摘要相关的语义片段,合成抽取文本;最后通过微调预训练语言模型PEGASUS对抽取文本进行摘要生成,以获得最佳生成摘要。在CAIL 2022涉法舆情摘要数据集上的实验结果表明,相比于其他的基线模型,该方法能够生成ROUGE和BLEU得分更高的摘要,进一步提升了摘要的可靠性。ive methods.Firstly,the long text is segmented into several semantic fragments.Then,an unsupervised contrastive learning method is employed to fine-tune the RoBERTa-wwm-ext model for semantic representation of these fragments.Subsequently,a dilate gated convolutional neural network is utilized to extract semantically relevant fragments and synthesize the extractive text.Finally,the fine-tuning is performed on the pre-trained language model PEGASUS to generate the optimal summary from the extracted text.Experimental results on the CAIL 2022 Judicial Opinion Summary Dataset demonstrate that,compared to other baseline models,this method is capable of generating summaries with higher ROUGE and BLEU scores.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7