谷歌发布含7种语言的全新数据集PAWS和PAWS-X  

在线阅读下载全文

作  者:本刊讯 

机构地区:[1]不详

出  处:《数据分析与知识发现》2019年第10期88-88,共1页Data Analysis and Knowledge Discovery

摘  要:近日,谷歌发布了包含7种语言释义对的全新数据集PAWS与PAWS-X。BERT通过该数据集的训练,在释义对问题上的精度实现了约3倍的提升,其他先进的模型也能够利用该数据集将精度提高到85%-90%。识别一对句子是否为释义对的任务则被称为释义识别,这一任务对于许多实际应用中的自然语言理解而言是非常重要的,例如:常见的问答任务等。但是,目前即使是最先进的模型(如BERT),如果仅在现有的自然语言理解数据集上进行训练,并不能正确地识别大部分非释义对之间的差异。其中很大的原因是由于在现有自然语言理解数据集中,缺少诸如此类的训练数据。

关 键 词:自然语言理解 数据集 谷歌 PAWS 训练数据 精度提高 释义 语言 

分 类 号:TP3[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象