检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:林群凯 陈钰枫[1] 徐金安[1] 张玉洁[1] 刘健[1] LIN Qunkai;CHEN Yufeng;XU Jin’an;ZHANG Yujie;LIU Jian(Beijing Key Lab of Traffic Data Analysis and Mining,Beijing Jiaotong University,Beijing 100044,China)
机构地区:[1]北京交通大学交通数据分析与挖掘北京市重点实验室,北京100044
出 处:《中文信息学报》2024年第6期119-128,共10页Journal of Chinese Information Processing
基 金:国家自然科学基金(61976016,61976015,61876198)。
摘 要:的目标是将长文本进行压缩、归纳和总结,从而形成具有概括性含义的短文本,其能帮助人们快速获取文档的主要信息。当前大多数的抽取式文本摘要的研究都是以整句作为抽取单元,而整句作为抽取单元会引入冗余信息,因此该文考虑使用粒度更细的抽取单元。已有研究表明,细粒度的子句单元比整句单元在抽取式摘要上更具有优势。结合当下热门的图神经网络,该文提出了一种基于子句单元异构图网络的抽取式摘要模型,有效融合了词、实体和子句单元等不同层次的语言信息,能够实现更细粒度的抽取式摘要。在大规模基准语料库(CNN/DM和NYT)上的实验结果表明,该模型产生了突破性的性能并优于以前的抽取式摘要模型。The goal of text summarization is to summarize long text into a short text with main information.To avoid the redundant information brought by the sentence extraction,we propose an extractive summarization model based on a heterogeneous graph network of sub-sentence units,which effectively integrates different levels of language information such as words,entities,and sub-sentential units.Experiments on two large scale benchmark corpora(CNN/DM and NYT)demonstrate that our model yields ground-breaking performance and outperforms previous extractive summarizers.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.49