- O, 두 텐서의 마지막 두 차원이 일치해야 한다
144p
2.x - 복사가 아닌 이동
154p
- O - 로스값이 작을 수록 좋음
162p
- X - RMSE는 MSE의 제곱근
165p
- X - 경사 하강법은 함수의 최소점을 찾기 위한 방법이다.
184
- X - 선형 회귀
203p
- O - 228
- X - Minibatch Gradient Descent는 일반적으로 전체 Gradient Descent보다 빠르다. (연산량 관련)
데이터셋을 나누어 한 번에 일부만 사용하기 때문에 더 빠른 업데이트가 가능하다.
269
- O
- O