Weight, Length2, Lengh3, Height, Width 속성 사용
여러 클래스에 대한 확률을 각각 구해야함 (multi-class classification)
근처의 n개의 데이터를 확인해 각 클래스 별 확률을 계산한다.
단, n개의 데이터를 이용하면 n+1의 가짓수의 확률만 나오게 된다.
선형 방정식을 학습하는 알고리즘이다.
$$ z = aw_1 + bw_2 + cw_3 +···+xw_n + f $$
로지스틱 회귀는 훈련 시 L2 규제가 적용된다. 규제 정도를 C로 나타낸다. alpha와 다르게 C는 커질 수록 규제가 완화된다.
*회귀라는 이름을 쓰지만 classifier의 일종이다. 각 클래스의 확률을 회귀로 구한 뒤 가장 높은 확률의 클래스로 분류하기 때문.
위의 z는 어떤 값이든 가능하다. 확률로 사용하기 위해 0~1의 범위로 제한해야 한다. 시그모이드 함수를 이용하면 범위를 정해줄 수 있다.
