4.3 데이터 전처리, 특성 공학, 특성 학습

신경망을 위한 데이터 전처리

현재까지 제가 느끼기에 딥러닝에 있어서 전처리 작업이 전부라고 느껴질 정도 입니다.

똑똑하신 분들이 만들어 놓은 모델을 가져다 쓰기 위해선

그 모델에서 잘 작동하게끔 데이터를 요리해놔야 하기 때문입니다.

Untitled

예시.

전에 CT사진을 통해 어떤 암인지 분류하는 모델을 만들어 봤습니다.

데이터가 충분치 않아서 예측률은 굉장히 떨어졌지만 전처리 작업을 해보는 것에 의의를 두었습니다.

우선 Label은 대세포암, 선암, 편평상피암, 정상 이렇게 총 네개입니다.

trainset을 학습을 시키고 test set을 주엇을때 암의 종류를 잘 구분하는지 확인을 했습니다.

각각의 사진은 크기가 다 다르기에 사이즈를 균일화 해주어야 했고

스케일도 해야했습니다.

Untitled