Why?

ICE Plot과 PDP Plot의 특징에 대해 논의하고 언제 어떤 방법을 쓸 수 있을지 구체적인 예시

Balang 2023. 5. 15. 16:51
728x90
  ICE Plot PDP Plot
특징 세세한 조건에서의 모델의 예측변화 확인 (Local) 특정 관측치에 대해, 특정 특성의 값을 변화시킬 때 모델의 예측 양상이 어떻게 변하는지 파악 모델의 해당 특성에 대한 전반적인 이해 방식 확인 (Global) 특정 관측치에 포커스를 두지 않음, 전체 평균에 집중 PDP Plot = ICE plot의 평균
장점 - 상호작용 관점에서 PDP보다 많은 인사이트를 발견할 수 있음

- 직관적으로 이해하기 쉬움
- 전반적인 모델 특성 확인에 용이함

- 직관적으로 이해하기 쉬움(특정 특성에 대한 모델의 복잡한 반응 양상을 이해하기 쉽게 시각화해줌)
단점 - 오직 하나의 특성만 의미있게 나타낼 수 있음 (그래프에 2개 이상의 특성을 그리면 알아보기 힘들어짐) + 샘플이 너무 많아도 알아보기 힘듦

- 일부 특성간 상관관계가 높은 경우 일부 포인트가 유효하지 않은 데이터 포인트가 될 수 있음
- 상호작용에 의해 생성된 이질적 관계(=이종효과)를 잘 발견하지 못함 (한 특성과 예측치 간의 평균적인 관계가 어떤지를 알려주는 것 뿐)

- 계산 시간 오래걸림

- 일부 특성간 상관관계가 높은 경우 일부 포인트가 유효하지 않은 데이터 포인트가 될 수 있음
활용 예시 - 개별 데이터 해석 (눈에 띄게 튀는 데이터, 특정 데이터 확인) - 행 집중, 개별 특성의 모델 예측 변화: 고위험군 추이 확인

ex.
(1) 신용 불량자 - 코인/주식 주식 투자 거래 내역과 기간 - 도박 여부(토토 등)

(2) 건강 적신호 - 젊을 때의 식단 - 집안/과거 내력 추적 등

(3) 특정 고객의 요청 - 예측에 대한 설명이 필요한 경우에는 ICE plot을 통해 더 자세한 설명을 할 수 있음
- 모델 해석에 대한 전반적인 설명에 활용 - 열 집중, 전체 특성의 모델 예측 변화: 이상징후 시점 확인

ex.
(1) 30대의 대출금 증가 → 원인: 신혼집 마련 → 추가 경제 정책 필요

(2) 청년 치매 증가 → 원인: 과도한 수능 스트레스 → 수능 정책 변화 필요

(3) 프로젝트에서 활용 Feature Importance에서 높게 가중치를 부여한 특성들을 순위를 매겨보고, 상위 몇 개만 뽑아서 PDP를 그려보는 방식으로 활용할 수 있을 듯
728x90
반응형