检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王匆匆 张仰森[1,2] 黄改娟 Wang Congcong;Zhang Yangsen;Huang Gaijuan(Institute of Intelligent Information Processing,Beijing Information Science and Technology University,Beijing 100101,China;Beijing Key Laboratory Internet Culture Digital Dissemination Research,Beijing 100101,China)
机构地区:[1]北京信息科技大学智能信息处理研究所,北京100101 [2]网络文化与数字传播北京市重点实验室,北京100101
出 处:《计算机应用与软件》2022年第6期141-147,共7页Computer Applications and Software
基 金:国家自然科学基金项目(61772081,61602044);科技创新服务能力建设-科研基地建设-北京实验室-国家经济安全预警工程北京实验室项目(PXM2018_014224_000010)。
摘 要:在中文文本纠错任务上,基于神经机器翻译的文本纠错模型已经取得最优表现。提出一种复制机制的纠错模型,它复制待纠错句子中的字词到目标生成文本中。由于中文文本纠错缺乏大量的标注数据,使用降噪自动编码器在大规模非标注中文语料库上预训练基于复制机制的模型。此外,还做了字级别和句子级别的多任务学习。实验结果显示,该方法在NLPCC2018中文文本纠错任务上取得最好成绩。In the task of Chinese text error correction,the text error correction model based on the neural machine translation has achieved the best performance.This paper proposes an error correction model of copy mechanism,which copies the words in the sentence to be corrected to the target generated text.Due to the lack of large amount of annotation data in Chinese text error correction,we used automatic noise reduction coder on large-scale non annotation Chinese corpus and pre-training model based on replication mechanism.In addition,we did word level and sentence level multi task learning.The experimental results show that this method achieves the best results in NLPCC2018 Chinese text error correction task.
分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7