检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:邓露 胡珀[1] 李炫宏 Deng Lu;Hu Po;Li Xuanhong(School of Computer Science,Central China Normal University,Wuhan 430079,China)
出 处:《数据分析与知识发现》2022年第11期1-12,共12页Data Analysis and Knowledge Discovery
基 金:国家语委科研项目(项目编号:YB135-149);中央高校基本科研业务费项目(项目编号:CCNU20ZT012)的研究成果之一。
摘 要:【目的】将生物医学文本映射到生物医学领域超级叙词表以获得文本中包含的生物医学术语及其对应概念,并将术语和概念作为背景知识融入文本摘要模型中,提高文本摘要模型在生物医学文本上的摘要生成质量。【方法】通过抽取式摘要技术获取文本的重要内容,然后结合生物医学领域知识库将文本重要内容中包含的术语与其对应的知识库概念一并抽取出来,作为背景知识融入神经网络生成式摘要模型的注意力机制中,使模型在领域知识引导下既可聚焦文本内部的重要信息,又可抑制因外部信息引入而可能产生的噪音问题,显著改善摘要的生成质量。【结果】在三个生物医学领域数据集上的实验结果验证了本文方法的有效性,本文所提模型PG-meta在三个数据集上的ROUGE均值达到31.06,比原PG模型ROUGE均值高1.51。【局限】未探索不同的生物医学领域背景知识获取方式对于模型增强效果的影响。【结论】本文方法可帮助模型更好地学习生物医学文本深层含义,提高摘要生成质量。[Objective]This study proposes a new text summarization model for biomedicine research,aiming to improve the quality of their abstracts.[Methods]First,we obtained the important contents of the biomedical texts with extractive abstracting technology.Then,we combined the important contents with related knowledge base to extract the key terms and their corresponding concepts.Third,we integrated these contents and concepts to the neural network abstrcting model as background knowledge for the attention mechanism.With the help of domain knowledge,the proposed model can not only focus on the important information from the texts,but also reduce the noises occurring due to the introduction of external information.[Results]We examined the proposed model with three biomedical data sets.The average ROUGE of the proposed model’s PG-meta reached 31.06,which was 1.51 higher than the average ROUGE of the original PG model.[Limitations]We did not investigate the impacts of different knowledge acquiring methods on the effectiveness of our model.[Conclusions]The proposed model can better learn the in-depth meaning of biomedical documents and improve the quality of their abstracts.
关 键 词:生物医学文本挖掘 生成式摘要 领域知识 知识增强
分 类 号:TP393[自动化与计算机技术—计算机应用技术] G250[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.128.226.211