检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李烨秋 唐竑轩 钱锦 邹博伟[1,2] 洪宇 LI Yeqiu;TANG Hongxuan;QIAN Jin;ZOU Bowei;HONG Yu(School of Computer Science and Technology,Soochow University,Suzhou 215000;Institute for Infocomm Research,Singapore 138632)
机构地区:[1]苏州大学计算机科学与技术学院,苏州215000 [2]新加坡资讯通信研究院,新加坡138632
出 处:《北京大学学报(自然科学版)》2021年第1期16-22,共7页Acta Scientiarum Naturalium Universitatis Pekinensis
基 金:国家自然科学基金(61703293,61672368,61672367);江苏高校优势学科建设工程项目资助。
摘 要:为了更好地评价阅读理解模型的鲁棒性,基于Dureader数据集,通过自动抽取和人工标注的方法,对过敏感、过稳定和泛化3个问题分别构建测试数据集。还提出基于答案抽取和掩码位置预测的多任务学习方法。实验结果表明,所提方法能显著地提高阅读理解模型的鲁棒性,所构建的测试集能够对模型的鲁棒性进行有效评估。In order to better evaluate the robustness of Machine Reading Comprehension(MRC)models,this paper builds three test sets from Dureader by automatically extracting and manually annotating,consisting of oversensitivity,over-stability,and generalization.In addition,this paper proposes a multi-task learning framework with answer extraction task and masked position prediction task.Experimental results demonstrate that proposed method gains significant robustness improvements and show the effectiveness of the three test sets on evaluating the robustness of MRC models.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7