1 분 소요

Image Classification (이미지 분류), Object Detection (객체 탐지), Segmentation(분할) 다음 세가지 개념을 비교해 보겠습니다.

1. Image Classification (이미지 분류)

기본 개념:

  • 이미지 분류는 주어진 이미지를 특정 클래스(또는 카테고리) 중 하나로 분류하는 작업입니다. 예를 들어, 이미지가 ‘고양이’인지 ‘강아지’인지, 혹은 ‘자동차’인지 ‘비행기’인지를 결정하는 것입니다.

출력 형태:

  • 이미지 전체에 대해 단 하나의 클래스 레이블을 출력합니다. 예를 들어, “이 이미지에는 고양이가 있다.”와 같은 결과를 제공합니다.

적용 사례:

  • 사진 앨범 정리: 사진에서 인물, 동물, 풍경 등을 자동으로 분류.
  • 의료 영상 분석: 특정 질병에 대한 유무를 판단하는 의료 이미지 분류.
  • 제품 인식: 온라인 쇼핑몰에서 상품 이미지를 분류하여 카테고리화.

딥러닝 모델:

  • VGGNet, ResNet, Inception, EfficientNet 등 다양한 CNN(Convolutional Neural Network) 기반 모델들이 이미지 분류 작업에 사용됩니다.

2. Object Detection (객체 탐지)

기본 개념:

  • 객체 탐지는 이미지에서 하나 이상의 특정 객체를 인식하고, 해당 객체의 위치를 바운딩 박스(bounding box)로 표시하는 작업입니다. 즉, 이미지 내의 객체가 어디에 위치해 있는지와 그 객체가 무엇인지를 동시에 예측합니다.

출력 형태:

  • 이미지 내의 객체마다 바운딩 박스와 해당 객체의 클래스 레이블이 출력됩니다. 예를 들어, “이 이미지에는 두 개의 객체(사람, 자동차)가 있으며, 각각의 위치는 이렇다.”와 같은 결과를 제공합니다.

적용 사례:

  • 자율주행 차량: 도로 위의 차량, 보행자, 신호등 등을 실시간으로 탐지.
  • 보안 시스템: CCTV 영상에서 침입자 탐지.
  • 리테일 분석: 매장 내 상품과 고객 행동 분석.

딥러닝 모델:

  • YOLO, SSD, Faster R-CNN, RetinaNet 등 다양한 모델들이 객체 탐지 작업에 사용됩니다.

3. Segmentation (분할)

기본 개념:

  • Segmentation은 이미지의 각 픽셀을 특정 클래스나 객체에 할당하는 작업입니다. 이는 이미지에서 객체의 정확한 모양과 경계를 파악하는 데 중점을 둡니다.

종류:

  • Semantic Segmentation: 이미지의 모든 픽셀을 클래스별로 분류하지만, 같은 클래스 내의 인스턴스는 구별하지 않습니다. 예를 들어, 이미지에 여러 사람이 있으면 모든 사람 픽셀을 같은 “사람” 클래스에 할당합니다.
  • Instance Segmentation: 이미지 내에서 같은 클래스의 객체라도 개별적으로 분할합니다. 즉, 각 객체의 인스턴스를 구별하여 분할합니다.

출력 형태:

  • 이미지의 각 픽셀이 어떤 클래스에 속하는지에 대한 마스크가 출력됩니다. 예를 들어, “이 이미지의 이 픽셀들은 사람, 저 픽셀들은 배경이다.”와 같은 결과를 제공합니다.

적용 사례:

  • 의료 영상 분석: 장기나 병변을 정확히 분할하여 진단.
  • 자율주행 차량: 도로, 차선, 보행자, 차량 등을 분할하여 주행 환경 이해.
  • 이미지 편집: 특정 객체만을 분리해내어 배경을 바꾸거나, 객체를 제거.

딥러닝 모델:

  • U-Net, SegNet, Mask R-CNN, DeepLab 등이 Segmentation 작업에 사용됩니다.

댓글남기기