[4장] 머신 러닝의 기본 요소

지도 학습(supervised learning) 예: 이진 분류, 다중 분류, 스칼라 회귀

지도 학습의 목표: 훈련 데이터의 입력과 타깃 사이에 있는 관계를 학습하는 것

지도 학습은 샘플 데이터가 주어지면 알고 있는 타깃에 입력 데이터를 매핑하는 방법을 학습하는 것이다.

대부분 분류와 회귀로 구분되지만 변종도 많다.

시퀀스 생성(sequence generation): 사진이 주어지면 이를 설명하는 캡션을 생성한다. 이것은 분류 문제로 재구성할 수 있다.
구문 트리(syntax tree) 예측: 문장이 주어지면 분해된 구문 트리를 예측한다.
물체 감지(object detection): 사진이 주어지면 사진 안의 특정 물체 주위에 경계 상자(bounding box)를 그린다. 이는 분류나 경계 상자의 좌표를 벡터 회귀로 예측하는 회귀와 분류가 결합된 문제로 표현될 수 있다.
이미지 분할(image segmentation): 사진이 주어졌을 때 픽셀 단위로 특정 물체에 마스킹 한다.

비지도 학습(unsupervised learning)은 타깃을 사용하지 않고 데이터의 변환을 찾는다.

데이터 시각화, 압축, 노이즈 제거 또는 데이터의 상관관계를 이해하기 위해 사용된다.

차원 축소(dimensionality reduction)와 군집(clustering)이 대표적이다.