1. O, 두 텐서의 마지막 두 차원이 일치해야 한다 144p

2.x - 복사가 아닌 이동 154p

  1. O - 로스값이 작을 수록 좋음 162p
  2. X - RMSE는 MSE의 제곱근 165p
  3. X - 경사 하강법은 함수의 최소점을 찾기 위한 방법이다. 184
  4. X - 선형 회귀 203p
  5. O - 228
  6. X - Minibatch Gradient Descent는 일반적으로 전체 Gradient Descent보다 빠르다. (연산량 관련) 데이터셋을 나누어 한 번에 일부만 사용하기 때문에 더 빠른 업데이트가 가능하다.

269

  1. O
  2. O