torch.optim.SGD()의 인자 lr은 1을 넘어설 수 있다. (X/O)
선형회귀분석을 할 때 zero_grad()를 처음에만 호출하는 것이 아니라 매 epoch마다 호출하는 이유는 무엇인가?

기울기값을 초기화하는함수
PYTORCH의 nn.Module를 상속받아 사용자 정의 모델을 생성할 때, 반드시 정의해야 하는 메소드는 무엇인가? (다중 선택 가능)
1. __init__()
2. forward()
3. train()
Learning rate와 Gradient의 곱만큼 감소시키는 이유를 설명하시오.
Hypothesis function에 대해 옳지 않은 것을 고르시오
1. H(x) = Wx + b로 표현하며, W는 weight, B는 bias이다.
2. 인공신경망의 구조를 나타낸다
3. W, x, b는 모두 일차원 vector 형태이다. : W(가중치)와 x(입력)는 문맥에 따라 벡터 또는 행렬일 수 있습니다. 특히, 다차원 데이터를 다루는 경우(예를 들어, 다중 선형 회귀) W와 x는 일반적으로 행렬 형태를 띄게 됩니다. b(편향)는 일반적으로 스칼라 또는 일차원 벡터 형태입니다.
4. 주어진 input(x)에 대해 어떤 output(y)을 예측할지 알려준다.

실습 문제