라마3는 폐기 해야 될 듯….
gpt의 경우 openai 서버 gpu로 답변을 바로바로 생성해주는데
llama3의 경우 따로 서버가 마련된 것이 아닌 오픈소스로 풀린거라 직접 24시간 gpu서버 구축해서
답변 생성 시에 외부 gpu서버 혹은 자체 gpu를 상시 돌려야됨..