Why?

결정트리는 왜 외삽이 어려울까?

Balang 2023. 5. 15. 16:49
728x90

그래프 : X 축은 년도, Y축은 해당 년도의 램 1MB 당 가격($기준)

설명

  • 선형 회귀 모델은 훈련 데이터와 테스트 데이터를 바탕으로 선을 그려 테스트 데이터(2000년 이후)를 꽤 정확히 예측
  • 트리 모델은 훈련 데이터가 위치한 영역을 분할하여 예측하는 것이기 때문에 범위 밖에 위치한 데이터에 대해서는 영역 분할이 되어있지 않으므로, 모델이 예측할 수가 없다
  • 트리 모델은 훈련 데이터를 완벽하게 예측하기 때문에 트리의 복잡도에 제한을 두지 않아서 전체 데이터셋을 모두 기억해서 모델이 가진 데이터 범위 밖으로 나가면(테스트 데이터) 단순히 마지막 포인트를 이용해 예측하는 게 전부
728x90
반응형