主编推送(一):合成数据  

Synthetic data generation--a must-have skill for new data scientists

在线阅读下载全文

出  处:《系统仿真技术》2020年第1期31-31,共1页System Simulation Technology

摘  要:合成数据与真实数据相对应。合成数据是指通过程序自动生成的数据,而不是在实际生产中采集或实际生活中调研得来的数据。当进行机器学习训练缺乏真实数据、或因为安全或隐私问题不便采用真实数据时,可考虑采用合成数据。通过合理设计程序,合成数据可具有许多有利于解决问题的特征。如,数据类型可以是数值型的、二进制的或明确分类的;数据的特征数量或数据集的大小可以是任意的;数据分布可以是随机的,且这种随机性可精确控制;对于分类问题,类的数量可控;对于回归问题,可用复杂的、非线性的过程拟合数据;随机噪声能以可控的方式注入合成数据。

关 键 词:程序自动生成 机器学习 数据类型 数据分布 数值型 隐私问题 合成数据 推送 

分 类 号:TP3[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象