4.1 머신 러닝의 네 가지 분류

이전 예제에서 3가지 종류(이진 분류, 다중 분류, 스칼라 회귀)의 머신 러닝 문제를 다루었다. 이 셋은 모두 지도 학습(supervised learning)의 예이다. 지도 학습의 목표는 훈련 데이터의 입력과 타깃 사이의 관계를 학습하는 것이다.

머신 러닝 알고리즘은 크게 총 4가지 범주에 대부분 속한다

가장 흔한 경우이다. 샘플데이터가 주어지면 알고 있는 타깃에 입력 데이터를 매핑하는 방법을 학습한다. 앞에서 나온 예제들 모두 지도 학습의 고전적 예시이다.

지도 학습은 대부분 분류와 회귀로 구성되나 다음과 같은 변종도 있다.

어떤 타깃도 사용하지 않고 입력 데이터에 흥미로운 변환을 찾는다. 데이터 시각화, 데이터 압축, 데이터 노이즈 제거 또는 데이터에 있는 상관관계를 더 잘 이해하기 위해 사용한다.

비지도 학습은 데이터 분석에 빼놓을 수 없는 요소이며, 지도 학습 문제를 풀기 전 데이터 셋을 잘 이해하기 위해 필수적으로 거치는 단계이다.

차원 축소(dimensionality reduction)와 군집(clustering)이 잘 알려진 범주이다.

지도 학습의 특수 케이스이지만 다르다. 사람이 만든 레이블을 사용하지 않고 보통 경험적인 알고리즘(heuristic algorithm)을 사용해서 입력 데이터로부터 생성한다.