학습 데이터셋에서의 오차가 일반화 오차에 비해 현격하게 낮아지는 현상
데이터 수집과정에서 편향 생길 수 있음
최종 목표는 학습 오차 최소화가 아님. 일반화 오차 최소화
오버피팅으로 전환되는 순간에 학습을 멈추는것이 가장 이상적
→ 검증 데이터셋 도입
❗검증 데이터셋을 활용한 최종 평가 수행은 평가 데이터를 이미 모델에게 노출한 것임
→ 오버피팅 해결 불가
결합 확률: 두개 이상의 변수를 사용
조건부 확률 ~ 가능도
답