
Bias과 Variance은 Trade Off 관계, 일반화 성능을 얻기 위해서 다음 중 어떤 방식을 선택하시겠습니까?
·
Why?
머신러닝의 기본 목표는 데이터를 잘 맞추는 동시에 가능한 간단한게 데이터를 피팅하는 것 위 정의를 달성하기 위해서는 낮은 편향과 낮은 분산을 가져야 한다. 모델 복잡도를 줄임으로써 Bias는 증가하고 Variance는 감소 반대로 모델 복잡도를 높이면 Bias는 감소 Variance는 증가 즉, 편향-분산은 내가 어떤 모델을 선택하든 두 개를 동시에 줄일 수는 없다. (반비례적, 시소효과) 결국 마지막 작업은 편향&분산의 균형을 잘 선택하는 것(최적값) 모델의 복잡도를 변경하며 중간의 일반화가 잘 되는 지점 을 잘 찾아주어야 한다 분산을 좀 주고 편향을 줄었으면 좋겠다 분산이 좀 크더라도 답이랑 비슷한 걸 스쳐갔으면 좋겠다. 편향을 좀 주고 분산을 줄였으면 좋겠다 분산을 좁히면 교정 전에는 답에서 어긋나..