전반적인 내용

머신러닝 용어와 데이터 전처리의 필요성

머신러닝 개념

분류(Classification)

여러 종류(Class)에서 하나의 종류로 구별해 내는 문제

머신러닝 학습 종류

데이터 용어 정리

그림1.png

샘플링 편향(sampling bias)

훈련 세트 or 테스트 세트에 샘플이 종류(class)별로 골고루 섞이지 않은 것

샘플링 편향이 발생하면 부적절한 결과가 도출될 수 있음

K-최근접 이웃(K-NN, K Nearest Neighbor) 알고리즘

가장 가까이 있는 K개의 데이터를 기준으로 데이터를 판별하는 알고리즘