测试集和验证集有什么区别-机器学习-[小象社区]

机器学习中,测试集和验证集有什么区别?

测试集用于评估模型经过训练后的性能。在训练期间使用验证集进行参数选择并防止训练集上的过度拟合。


是这样的吗?

已邀请:
  • 训练集 (训练阶段)
用于构建我们的模型,我们的模型在训练集上进行学习,通常在这个阶段我们可以有多种方法进行训练
  • 验证集 (模型挑选阶段)
用于挑选最优模型超参的样本集合:使用验证集可以得到反向传播什么时候结束以及超参怎么设置最合理。主要目的是为了挑选在验证集上表现最好的模型。
  • 测试集 (验证阶段 评估泛化误差)
在我们挑选好验证集上表现最好的模型之后,用于评估该模型泛化能力的数据集。

那么验证集和测试集到底有什么区别?

简单来说,模型在验证集上的表现是有偏估计,虽然训练模型的时候没有用到验证集上的数据,但是我们在挑选模型时,还是间接地泄露了验证集的相关信息:我们让模型知道怎么样的参数设置会让它在该数据集上表现良好或者表现差劲。

此时和模型训练挑选过程完全独立的测试集此时就变得更加重要了,它往往代表这模型在真实世界应用场景下模型的泛化表现能力。

要回复问题请先登录注册