Why?

Test set을 분리했는데도 Validation set을 분리하는 이유는?

Balang 2023. 5. 15. 16:44
728x90

  • Training set: 모델을 학습하는데 사용
  • Validation set: training set으로 만들어진 모델의 성능을 측정하기 위해 사용
  • Test set: validation set으로 사용될 모델이 결정 된 후, 마지막으로 딱 한번 해당 모델의 성능을 측정하기 위해 사용
  • 비율은 정해진 건 없지만 일반적으로 60 : 20 : 20

Validation set과 Test set의 차이

  • Validation set은 **여러 모델들 각각에 적용되어 성능을 측정**하여 최종 모델을 선정하기 위해 사용, **학습에 관여**
  • Test set은 최종 모델에 대해 단 한번 성능을 측정, **학습에 관여X**

Test set을 분리했는데도 Validation set을 분리하는 이유?

  • Test set을 평가 도구로 사용해 학습에 관여 시키면 모델이 Test set에 과적합 되고, 새로운 데이터에 대해 예측을 잘 못하기 때문에 그것을 방지하기 위해 Validation set이 필요함
728x90
반응형