Yolov8은 다양한 크기의 이미지를 처리할 수 있지만, 모든 이미지를 고정된 크기로 맞추는 것이 일반적이다. 이미지 크기를 모델이 기대하는 입력 크기로 맞추면 처리 속도가 빨라지고 메모리 사용량이 최적화된다.
EX) 640x640 or 512x512 크기로 조정
이미지를 정규화하면 픽셀 값이 [0, 1] 범위로 조정되거나 [-1, 1] 범위로 변환한다. Yolov8 모델에서는 정규화가 필요할 수 있으니, 사용하는 라이브러리에서 자동으로 수행하는지 확인하거나 수동 처리가 필요
훈련 데이터의 다양성을 높이기 위해 데이터 증강을 활용하는 것이 좋다. 다음과 같은 증강 기법이 일반적으로 사용된다:
Library: Albumentations, imgaug
객체 탐지에서는 객체가 사진의 일부분만 차지할 경우가 많으므로, 전경(객체)과 배경의 비율을 적절히 조정하는 것도 성능 향상에 기여할 수 있다.
흐리거나 노이즈가 많은 이미지를 개선하는 전처리도 가능하다.
예를 들어, 이미지 디노이징이나 샤프닝을 통해 모델이 객체를 더 명확히 인식하도록 할 수 있다.
Library: OpenCV(디노이징, 샤프닝), scikit-image(디노이징, 샤프닝),
Pillow(샤프닝)