《自然》  

在线阅读下载全文

出  处:《科学中国人》2025年第3期10-15,共6页Scientific Chinese

摘  要:使用递归生成数据训练的AI模型会发生崩溃。《自然》封面:错误输出。《自然》杂志第8022期封面文章报道了将A I生成的数据输入一个模型,会导致后续几代模型退化直到崩溃。在一项测试中,关于中世纪建筑的原始文本到了第九代居然变成了一串野兔的名字!生成式人工智能(A I)工具(如大语言模型)的爆发得益于用来训练它们的由人类生成的大型数据集。随着这些工具不断涌现,以及它们输出的结果在网络上不断增多,训练数据的来源必然会转向计算机生成的内容。使用A I生成数据训练模型并非不可能,但需要非常仔细地过滤这些数据,而人类生成的数据可能仍具优势。

关 键 词:递归生成数据 AI模型 中世纪建筑 生成式人工智能 大型数据集 计算机生成内容 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程] TP3[自动化与计算机技术—控制科学与工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象