6장. 일반적인 머신 러닝 워크플로

지금까지는 케라스에서 이미 만들어진 데이터셋을 이용하여 모델 훈련을 진행하였다.

하지만 실제로는 데이터셋이 만들어지지 않은 경우가 더 많다. 딥러닝 모델을 세우는 데 필요한 여러가지 단계, 즉 워크플로를 알아보자.

먼저 해결하고자 하는 문제가 머신러닝으로 해결할 수 있는 문제인지 아닌지 알아야한다.

그리고, 인공지능 모델을 세울 때는 다음 두가지 조건이 참이라고 가정하고(가설) 진행한다.

데이터 수집

머신 러닝 프로젝트에서 시간이 가장 많이 걸리고, 그만큼 가장 중요한 작업이다.

<aside> 💡 “Garbage in, garbage out.” (쓰레기가 들어가면, 쓰레기가 나온다.)

</aside>

지도학습의 경우, 훈련데이터에 일일히 레이블을 달아주어야 할 수도 있다. 또한, 레이블링을 진행할 때도, 작업자가 전문가여야 하는지 아닌지, 전문적인 지식을 위한 사람을 훈련시킬 것인지 아닌지도 고려해야한다.

개념 이동