728x90
딥러닝은 머신러닝보다 데이터에 더 의존 —> 딥러닝은 데이터 양에 비례한 성능을 갖기 때문에 머신러닝보다 훨씬 많은 양과 크기의 데이터가 필요하다.
- 머신러닝 : 규칙을 일일이 프로그래밍하지 않아도 자동으로 데이터에서 규칙을 학습하는 알고리즘을 연구하는 분야
- 인공지능의 한 분야
- 딥러닝은 인공 신경망을 기반으로 한 방법
- 머신러닝의 한 분야
- 딥러닝의 deep은 머신러닝보다 데이터의 양이 많아지고 중간 처리과정이 깊어져서 딥러닝이라고 함
<차이점>
- 머신러닝 : 사람을 학습시키는 과정에서 착안한 방법을 사용해서 어떤 데이터의 입력 값과 이에 대응한 출력 값을 알려주면 출력방법에 대해 스스로 학습함 —> 특성공학이 중요
- 사람이 개입함
- 딥러닝 : 머신러닝과 같이 스스로 학습한다는 점에서는 동일하나, 출력 값에 대한 정보를 학습시키지 않으며, 분류를 위한 특징조차 스스로 학습함 (실수까지 학습) —> 딥러닝은 대부분 특성공학이 필요하지 않음(특성 부분에서만 사람 개입 X)
- 장점
- 성능
- 머신러닝은 사람이 직접 도메인 지식에 기반한 특성을 추출하여 모델을 학습시킴.
밝혀지지 않은 사실들을 학습해나가기 때문에 머신러닝보다 성능이 더 좋을 수 있음.
그 결과 딥러닝은 컴퓨터가 스스로 하지만 딥러닝은 이 과정을 생략하고 컴퓨터가 스스로 주어진 데이터를 기반으로 학습하게 함.
- 머신러닝은 사람이 직접 도메인 지식에 기반한 특성을 추출하여 모델을 학습시킴.
- 성능
- 단점
- (아까 말씀드린) 데이터 의존도
- 딥러닝 모델은 양질의 데이터가 많을수록 더 좋은 성능을 내기 때문에 매우 큰 데이터를 필요로 한다. 그렇기 때문에 데이터의 양이 적다면 성능은 떨어질 수 밖에 없다.딥러닝 알고리즘은 왜 그런 결과를 냈는지에 대한 과정을 해석할 수 없기 때문에 흔히 블랙박스 모델이라고 불린다.
- 불가능한 해석
- 딥러닝 알고리즘은 왜 그런 결과를 냈는지에 대한 과정을 해석할 수 없기 때문에 흔히 블랙박스 모델이라고 불린다.
- 학습 속도 문제 : 데이터의 개수가 폭발적으로 증가하여 딥러닝 모델 학습 시 소요되는 시간도 함께 증가함
728x90
반응형
'Why?' 카테고리의 다른 글
seed()는 왜 지정할까? (0) | 2023.08.23 |
---|---|
왜 제너레이터는 메모리 사용을 효과적으로 사용할까? (0) | 2023.05.15 |
왜 Cloud 방식으로 데이터를 저장할까? (0) | 2023.05.15 |
PDP의 해석 시 유의할 점 (0) | 2023.05.15 |
ICE Plot과 PDP Plot의 특징에 대해 논의하고 언제 어떤 방법을 쓸 수 있을지 구체적인 예시 (0) | 2023.05.15 |