불균형 데이터 처리

추천하는 방식은 Algorithm Over sampling 또는 Cost-sensitive learning 방식이다.

불균형 클래스 분류(Imbalanced Classification)를 위한 4가지 방법

데이터 결측치 처리

Data Imputation(데이터 결측치 처리)

결측치(Missing values, Nulls) 처리에 대해서 (Imputation): SimpleImputer, IterativeImputer, MICE ..

adkal.com

데이터 합병

train_base, train_static_0 : 특별한 처리없이 concat

나머지 데이터프레임 : case_id로 join