Google Colaboratory

이론 문제1. rainmapmap

다음중 Supervised learning과 Unsupervised learning에 대하여 틀리게 설명한 것을 골라 주세요.

  1. Supervised learning은 지도학습이라고 불리며 특정 사진을 보고 개인지 고양이인지 분류하는 모델을 만들 수 있다.
  2. Unsupervised learning은 비지도학습이라고 불리며 여러 동물 사진을 특징 별로 군집화를 할 수 있다.
  3. Supervised learning은 feature가 여러 개여도 문제없이 학습이 가능하다.
  4. Unsupervised learning은 데이터 중 trai2ning set이 없어도 학습이 가능하다.

4번. Unsupervised Learing은 training set이 없이 데이터 특징 요약과 군집화를 수행함

이론 문제 2. DATASET을 구분해보자

Dataset에 대한 설명 중 틀린 것을 모두 골라 주세요.

  1. 학습이 끝난 후 모델 평가에 쓰이는 Test set은 Train set에서 사용하지 않은 데이터여야 한다.
  2. 1.의 이유는 평가를 할 때에는 모델이 본 적있는 데이터가 아닌 처음 보는 데이터로 해야하기 때문이다.
  3. Dataset을 Train set : Test set = 1 : 1 비율로 나누면 Overfitting이 발생할 수 있다.
  4. Overfitting을 방지하기 위한 방법으로 Validation set를 만드는 방법이 있다.
  5. Validation set의 사용 목적은 Test set과 일치한다.

1번. Test set는 Train set에 사용하지 않은 데이터나, Train set에서 일부를 떼어 낸 데이터를 사용함.

5번. Test set은 모델의 '최종 성능'을 평가하기 위한 목적이지만, Validation set는 '최종 모델'을 선정하기 위해 모델을 개선하는 목적임.