전반적인 내용
머신러닝 용어와 데이터 전처리의 필요성
머신러닝 개념
분류(Classification)
여러 종류(Class)에서 하나의 종류로 구별해 내는 문제
머신러닝 학습 종류
- 비지도학습 : 데이터와 타깃을 이용하여 데이터의 종류(Class)를 알려주는 학습
- 지도학습 : 데이터만을 이용하여 데이터의 종류(Class)는 알아서 학습
- 강화학습 : 알고리즘이 행동한 결과로 얻어지는 보상을 기준으로 학습
데이터 용어 정리

샘플링 편향(sampling bias)
훈련 세트 or 테스트 세트에 샘플이 종류(class)별로 골고루 섞이지 않은 것
샘플링 편향이 발생하면 부적절한 결과가 도출될 수 있음
K-최근접 이웃(K-NN, K Nearest Neighbor) 알고리즘
가장 가까이 있는 K개의 데이터를 기준으로 데이터를 판별하는 알고리즘