시행착오를 통한 학습 (보상을 최대화하는 방법 모색)