머신러닝과 비교했을 때, 딥러닝이 가지고 있는 장단점은?

2023. 5. 15. 16:58·Why?
728x90

딥러닝은 머신러닝보다 데이터에 더 의존 —> 딥러닝은 데이터 양에 비례한 성능을 갖기 때문에 머신러닝보다 훨씬 많은 양과 크기의 데이터가 필요하다.

  • 머신러닝 : 규칙을 일일이 프로그래밍하지 않아도 자동으로 데이터에서 규칙을 학습하는 알고리즘을 연구하는 분야
    • 인공지능의 한 분야
  • 딥러닝은 인공 신경망을 기반으로 한 방법
    • 머신러닝의 한 분야
    • 딥러닝의 deep은 머신러닝보다 데이터의 양이 많아지고 중간 처리과정이 깊어져서 딥러닝이라고 함

<차이점>

  • 머신러닝 : 사람을 학습시키는 과정에서 착안한 방법을 사용해서 어떤 데이터의 입력 값과 이에 대응한 출력 값을 알려주면 출력방법에 대해 스스로 학습함 —> 특성공학이 중요
    • 사람이 개입함
  • 딥러닝 : 머신러닝과 같이 스스로 학습한다는 점에서는 동일하나, 출력 값에 대한 정보를 학습시키지 않으며, 분류를 위한 특징조차 스스로 학습함 (실수까지 학습) —> 딥러닝은 대부분 특성공학이 필요하지 않음(특성 부분에서만 사람 개입 X)
  1. 장점
    1.  성능
      1. 머신러닝은 사람이 직접 도메인 지식에 기반한 특성을 추출하여 모델을 학습시킴.
        밝혀지지 않은 사실들을 학습해나가기 때문에 머신러닝보다 성능이 더 좋을 수 있음.
        그 결과 딥러닝은 컴퓨터가 스스로 하지만 딥러닝은 이 과정을 생략하고 컴퓨터가 스스로 주어진 데이터를 기반으로 학습하게 함.

  2. 단점
    1. (아까 말씀드린) 데이터 의존도
      1. 딥러닝 모델은 양질의 데이터가 많을수록 더 좋은 성능을 내기 때문에 매우 큰 데이터를 필요로 한다. 그렇기 때문에 데이터의 양이 적다면 성능은 떨어질 수 밖에 없다.딥러닝 알고리즘은 왜 그런 결과를 냈는지에 대한 과정을 해석할 수 없기 때문에 흔히 블랙박스 모델이라고 불린다.
    2. 불가능한 해석
      1. 딥러닝 알고리즘은 왜 그런 결과를 냈는지에 대한 과정을 해석할 수 없기 때문에 흔히 블랙박스 모델이라고 불린다.
    3. 학습 속도 문제 : 데이터의 개수가 폭발적으로 증가하여 딥러닝 모델 학습 시 소요되는 시간도 함께 증가함
728x90
반응형

'Why?' 카테고리의 다른 글

seed()는 왜 지정할까?  (0) 2023.08.23
왜 제너레이터는 메모리 사용을 효과적으로 사용할까?  (0) 2023.05.15
왜 Cloud 방식으로 데이터를 저장할까?  (0) 2023.05.15
PDP의 해석 시 유의할 점  (0) 2023.05.15
ICE Plot과 PDP Plot의 특징에 대해 논의하고 언제 어떤 방법을 쓸 수 있을지 구체적인 예시  (0) 2023.05.15
'Why?' 카테고리의 다른 글
  • seed()는 왜 지정할까?
  • 왜 제너레이터는 메모리 사용을 효과적으로 사용할까?
  • 왜 Cloud 방식으로 데이터를 저장할까?
  • PDP의 해석 시 유의할 점
Balang
Balang
음악 전공생의 개발일지
  • Balang
    Balang
    Balang
  • 전체
    오늘
    어제
  • 반응형
    • All Post (147) N
      • python (45)
        • selenium (4)
        • algorithm (9)
        • Django (6)
        • Pandas | Numpy (22)
      • SQL (9)
      • Data Engineer (29)
      • Data Scientist (3)
      • Data Analysis (9)
      • Computer Science (35)
      • Why? (15)
      • 마음가짐 (2) N
  • 인기 글

  • 최근 댓글

  • 최근 글

  • 250x250
  • hELLO· Designed By정상우.v4.10.3
Balang
머신러닝과 비교했을 때, 딥러닝이 가지고 있는 장단점은?
상단으로

티스토리툴바