基于深度学习的多文档机器阅读理解综述  被引量:1

Survey of Multi-document Machine Reading Comprehension Based on Deep Learning

在线阅读下载全文

作  者:高峰[1,2] 倪建成[3] 高鹏 周子力 李艳艳[1] GAO Feng;NI Jiancheng;GAO Peng;ZHOU Zili;LI Yanyan(School of Cyber Science and Engineering,Qufu Normial University,Qufu,Shandong 273165,China;School of Computer Science and Technology,East China Normial University,Shanghai 200062,China;Network Information Center,Qufu Normial University,Qufu,Shandong 273165,China)

机构地区:[1]曲阜师范大学网络空间安全学院,山东曲阜273165 [2]华东师范大学计算机科学与技术学院,上海200062 [3]曲阜师范大学网络信息中心,山东曲阜273165

出  处:《中文信息学报》2023年第8期1-17,共17页Journal of Chinese Information Processing

基  金:曲阜师范大学高层次人才科研基金(602801)。

摘  要:多文档机器阅读理解是利用计算机同时将多个文档的语义信息进行阅读理解、筛选糅合后进行问题作答的过程。与传统的单文档机器阅读理解相比,其更关注问题约束下的文档间语义逻辑关系理解,是自然语言处理领域中新兴的研究方向之一。该文首先选取了多文档机器阅读理解的重点数据集,涵盖多源信息型数据集、线性推理型数据集和细粒度半结构化型数据集等以分析任务发展趋势;其次调研了深度学习领域中主流的评价指标和研究方法,划分了具有代表性的四层阅读架构并分别展开了详细的讨论,特别在阅读理解层中选取了文档选择、Transformer语言模型、图卷积神经网络和外部知识融合等阅读方法以分析任务的研究现状;最后对多文档阅读理解的研究进行了总结与展望,提出了后续研究面临的问题与挑战。Multi-document machine reading comprehension requires the machine to read and comprehend multi documents simultaneously,so as to answer subsequent questions.Compared with the traditional single-document machine reading comprehension,it is more concerned with the semantic logic among the documents within the constraints of questions.The paper firstly explores the main datasets for multi-document machine reading comprehension to analyze its development trends,including multi-source datasets,linear inference datasets,and fine-grained semi-structured datasets.Secondly,it investigates the mainstream evaluation metrics,then a prototype of four-tier reading structure is discussed in detail.This paper also reviews the methods based on document selection,Transformers,Graph Convolution Networks,and external knowledge fusion.Finally,it gives an outlook on the research of multi-document reading comprehension,as well as the problems and challenges in this study.

关 键 词:综述 多文档机器阅读理解 深度学习 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象