03-1 k최근접 이웃 회귀

생선 무게 예측 문제

데이터

생선 분류 문제 데이터와 동일한 csv

Speices가 Perch인 샘플만 사용

이전 문제와 차이점

생선 무게 예측은 임의의 수로 결과가 나옴

해결 - KNN regression

KNN regression을 이용

주변 n개의 데이터의 평균값으로 예측

KNN regression의 score - R2 결정계수

SST: 총 변동, $sum((타깃 - 평균)^2)$

SSR: 설명 가능한 변동, 클 수록 예측이 잘 됐다는 의미, $SST - SSE$

SSE: 설명 불가능한 변동, $sum((타깃-예측)^2)$

$R^2 = SSR/SST = 1 - SSE/SST$

$R^2$이 1에 가까울 수록 X와 Y의 선형 상관 관계의 정도가 크다.

KNN regression의 다른 평가 지표

mean_absolute_error: 타깃과 예측의 절댓값 오차의 평균

Overfitting vs Underfitting