CH 12 오버피팅 방지하는 방법

학습 데이터셋에서의 오차가 일반화 오차에 비해 현격하게 낮아지는 현상

데이터 수집과정에서 편향 생길 수 있음

최종 목표는 학습 오차 최소화가 아님. 일반화 오차 최소화

오버피팅으로 전환되는 순간에 학습을 멈추는것이 가장 이상적

→ 검증 데이터셋 도입

❗검증 데이터셋을 활용한 최종 평가 수행은 평가 데이터를 이미 모델에게 노출한 것임

→ 오버피팅 해결 불가

→ 학습 데이터셋/검증 데이터셋/테스트 데이터셋 으로 분류

CH 17 확률론적 관점

결합 확률: 두개 이상의 변수를 사용

조건부 확률 ~ 가능도

  1. X 임계값이 고정되어 있을 때 (352)