Bias과 Variance은 Trade Off 관계, 일반화 성능을 얻기 위해서 다음 중 어떤 방식을 선택하시겠습니까?
·
Why?
머신러닝의 기본 목표는 데이터를 잘 맞추는 동시에 가능한 간단한게 데이터를 피팅하는 것 위 정의를 달성하기 위해서는 낮은 편향과 낮은 분산을 가져야 한다. 모델 복잡도를 줄임으로써 Bias는 증가하고 Variance는 감소 반대로 모델 복잡도를 높이면 Bias는 감소 Variance는 증가 즉, 편향-분산은 내가 어떤 모델을 선택하든 두 개를 동시에 줄일 수는 없다. (반비례적, 시소효과) 결국 마지막 작업은 편향&분산의 균형을 잘 선택하는 것(최적값) 모델의 복잡도를 변경하며 중간의 일반화가 잘 되는 지점 을 잘 찾아주어야 한다 분산을 좀 주고 편향을 줄었으면 좋겠다 분산이 좀 크더라도 답이랑 비슷한 걸 스쳐갔으면 좋겠다. 편향을 좀 주고 분산을 줄였으면 좋겠다 분산을 좁히면 교정 전에는 답에서 어긋나..
Test set을 분리했는데도 Validation set을 분리하는 이유는?
·
Why?
Training set: 모델을 학습하는데 사용 Validation set: training set으로 만들어진 모델의 성능을 측정하기 위해 사용 Test set: validation set으로 사용될 모델이 결정 된 후, 마지막으로 딱 한번 해당 모델의 성능을 측정하기 위해 사용 비율은 정해진 건 없지만 일반적으로 60 : 20 : 20 Validation set과 Test set의 차이 Validation set은 **여러 모델들 각각에 적용되어 성능을 측정**하여 최종 모델을 선정하기 위해 사용, **학습에 관여** Test set은 최종 모델에 대해 단 한번 성능을 측정, **학습에 관여X** Test set을 분리했는데도 Validation set을 분리하는 이유? Test set을 평가 도구로..
Status code 정리 (100 ~ 500)
·
Data Engineer
HTTP 상태 코드(Status code)란? 사용자가 웹 브라우저를 통해 웹 서버에 어떠한 요청을 할 경우, 웹 서버는 요청에 대한 응답으로 아래와 같은 HTTP 상태 코드를 나타낸다. 응답은 HTTP 요청이 성공했는지 실패했는지를 서버에서 알려주는 코드에 따라 5개의 그룹으로 나누어진다. HTTP(HyperText Transfer Protocol, 하이퍼텍스트 전송 프로토콜) 상태 코드를 통하여 사용자는 현재 서버에 어떠한 오류가 있는지를 확인할 수 있다. 자세한 내용은 IANA 또는 W3C에서 확인할 수 있다. 상태 코드 종류 Information : 100번대(정보 응답) 코드 설명 100 Countinue- 서버가 request 헤더는 받았고, 클라이언트가 request 바디 부분을 보내고 있는..