이론 문제 (10점)
(O/X)
- (O)
- (X). 편향이 3개일 필요는 없다.
- (X). 기울기 값을 초기화 하는 단계에 사용되는 함수는 step()이 아닌 zero_grad()이다.
- (O)
- (X). MSE는 (예측값-실제값)을 제곱한 값들의 평균이다.
- (O)
- (X). learning rate를 지나치게 크게 설정할 경우 W값이 발산하여 예측이 어려워질 수 있다.
- (X). torch.zeros((7, 1), requires_grad=True)로 선언해야 한다.
- (O).
- (X). - (y_train[0] * torch.log(hypothesis[0]) + (1 – y_train[0]) * torch.log(1 – hypothesis[0]))
실습 문제 (15점)