**객체 탐지(Object Detection)**란 이미지나 영상에서 특정 객체를 탐지하고 영역을 인식하는 컴퓨터비전 기술이다. 객체 탐지는 크게 물체의 분류 작업과 지역화 작업으로 나눌 수 있다.

객체 영역을 표현하는 방법은 두 가지가 존재한다.

객체 탐지 방법

  1. 경계 탐사 탐지

    경계 상자를 활용해 객체의 영역을 간단하게 표현하는 방법으로, 다른 객체 검출 방법에 비해 처리 속도가 빠르지만 객체의 상세한 영역을 파악하기 어렵다.

  2. 의미론적 분할

    마스크 방식을 사용해 이미지에서 객체와 배경을 픽셀 단위로 분할하는 방식이다. 객체의 상세한 모양을 확인할 수 있고, 배경과 같이 광범위한 영역의 객체도 검출할 수 있지만, 계산 비용이 높고 객체 간 경계에서 오분류할 가능성이 높다.

  3. 객체 분할

    객체를 픽셀 단위로 분리하고, 경계 상자와 클래스 레이블을 추출한다. 경계 상자와 마스크 방식을 모두 사용하므로 다른 방법보다 높은 계산 비용을 필요로 하며, 더 많은 학습 데이터를 요구한다.

Faster R-CNN


Faster R-CNN은 Fast R-CNN 모델을 개선해 제안한 방법으로 객체 탐지에 사용되는 모델이다. 이 모델은 중간 단계에서의 처리나 변환 없이 입력과 출력 사이의 관계를 직접 학습해 결과를 예측한다. 모델 구성과 훈련이 다욱 간단하고 효율적으로 이뤄진다. 또한 모델의 유연성이 뛰어나 다른 모델과의 조합을 통해 성능을 높일 수 있다.

변천 과정: R-CNN → Fast R-CNN → Faster R-CNN

R-CNN