使用合成数据已成为机器学习中一种日益流行的做法,尤其是在监督学习和强化学习等领域。合成数据是指人工生成的数据,它模仿真实数据的特征。它具有多种优势,包括生成大量标记数据以及模拟不同场景以进行训练和评估的能力。
到目前为止,在AutoML.org,我们主要在两个活跃的研究领域中使用合成数据来训练神经网络:PFN 和学习合成强化学习环境。在前者,我们使用合成数据生成过程来(元)预训练 PFN。在后者,我们通过元学习学习合成数据(或强化学习环境)本身,以有效地训练强化学习智能体。有关更多详细信息,请参阅下面的博客文章
