[4장] 머신 러닝의 기본 요소
4.1 머신 러닝의 네 가지 분류
지도 학습(supervised learning) 예: 이진 분류, 다중 분류, 스칼라 회귀
지도 학습의 목표: 훈련 데이터의 입력과 타깃 사이에 있는 관계를 학습하는 것
4.1.1 지도 학습
지도 학습은 샘플 데이터가 주어지면 알고 있는 타깃에 입력 데이터를 매핑하는 방법을 학습하는 것이다.
대부분 분류와 회귀로 구분되지만 변종도 많다.
- 시퀀스 생성(sequence generation): 사진이 주어지면 이를 설명하는 캡션을 생성한다. 이것은 분류 문제로 재구성할 수 있다.
- 구문 트리(syntax tree) 예측: 문장이 주어지면 분해된 구문 트리를 예측한다.
- 물체 감지(object detection): 사진이 주어지면 사진 안의 특정 물체 주위에 경계 상자(bounding box)를 그린다. 이는 분류나 경계 상자의 좌표를 벡터 회귀로 예측하는 회귀와 분류가 결합된 문제로 표현될 수 있다.
- 이미지 분할(image segmentation): 사진이 주어졌을 때 픽셀 단위로 특정 물체에 마스킹 한다.
4.1.2 비지도 학습
비지도 학습(unsupervised learning)은 타깃을 사용하지 않고 데이터의 변환을 찾는다.
데이터 시각화, 압축, 노이즈 제거 또는 데이터의 상관관계를 이해하기 위해 사용된다.
차원 축소(dimensionality reduction)와 군집(clustering)이 대표적이다.
4.1.3 자기 지도 학습