Supervised learning → 지도학습
Unsupervised learning → 비지도학습
정답 : 4
해설 : 비지도 학습은 무엇을 예측할 수 없음. 입력 데이터만 존재하므로 훈련이 불가능함
Overfitting
학습 데이터를 training set 과 test set 으로 나누어 이용함에 따라 training set 에서의 overfitting 을 방지한다.
학습을 계속 시킬수록 training set 의 정확도는 계속해서 증가할 것이다.
하지만 필요 이상의 학습으로 overfitting 될 경우 test set 에서의 정확도는 점점 떨어진다.
대부분 train set : test set = 8 : 2 또는 9 : 1
(정리)
training data 에 대해 과하게 학습된 상황
training data 에 대한 정확도는 높지만 실제 test 에서는 에러가 날 수 있는 상황, 즉 학습 데이터 이외의 데이터에 대해서는 모델이 잘 동작하지 못한다.
Validation set
사용 이유
: 모델의 성능을 평가하기 위해서
: overfitting 막을 수 있음
Underfitting