-
torch.optim.SGD()의 인자 lr은 1을 넘어설 수 있다. (X/O)
-
선형회귀분석을 할 때 zero_grad()를 처음에만 호출하는 것이 아니라 매 epoch마다 호출하는 이유는 무엇인가?
기울기값을 초기화하는함수
-
PYTORCH의 nn.Module를 상속받아 사용자 정의 모델을 생성할 때, 반드시 정의해야 하는 메소드는 무엇인가? (다중 선택 가능)
- __init__()
- forward()
- train()
-
Learning rate와 Gradient의 곱만큼 감소시키는 이유를 설명하시오.
-
Hypothesis function에 대해 옳지 않은 것을 고르시오
- H(x) = Wx + b로 표현하며, W는 weight, B는 bias이다.
- 인공신경망의 구조를 나타낸다
- W, x, b는 모두 일차원 vector 형태이다.
: W(가중치)와 x(입력)는 문맥에 따라 벡터 또는 행렬일 수 있습니다. 특히, 다차원 데이터를 다루는 경우(예를 들어, 다중 선형 회귀) W와 x는 일반적으로 행렬 형태를 띄게 됩니다. b(편향)는 일반적으로 스칼라 또는 일차원 벡터 형태입니다.
- 주어진 input(x)에 대해 어떤 output(y)을 예측할지 알려준다.