1번

문제내용

o/x 문제입니다. 맞는 문장에 O, 틀린 문장에 X를 해주세요. (틀린 문장은 올바르게 고쳐주세요!)

  1. 결정계수 R^2은 예측이 타깃의 평균정도로 예측할 때 1에 가까운 값이 된다. 또한, 결정계수(R^2)은 대표적인 회귀 문제의 성능 측정 도구로써, 1에 가까울수록 성능이 좋은 모델이다.

    X

  2. multiple-regression은 독립변수가 두개이상 으로써, 이러한 여러 특성들을 조합하는 것을 특성공학이라고 하고, polynomial-regression은 독립변수가 하나를 가지고 있으며, polynomial-regression은 multiple-regression의 일종이라고 할 수 있다.

  3. 다음 그래프는 집값을 선형 회귀로 표현한 그래프이다.

    Linear Regression of Housing Prices with Various Model

    Linear Regression of Housing Prices with Various Model

    Linear Regression of Housing Prices with Various Model

    Linear Regression of Housing Prices with Various Model

    Linear Regression of Housing Prices with Various Model

    Linear Regression of Housing Prices with Various Model

    Linear Regression of Housing Prices with Various Model

    Linear Regression of Housing Prices with Various Model

    왼쪽에서부터 순서대로 그래프 1, 2, 3이라고 할 때, 그래프 1 - Underfitting, 그래프 2 - Overfitting, 그래프 3 - Appropriate fitting 이라고 할 수 있다.

  4. 규제는 언더피팅과 오버피팅을 방지할 수 있다.

  5. 사이킷런의 변환기에서는 훈련(fit)과 변환(transform)의 순서는 중요하지 않다.

  6. 선형회귀로 풀 수 있는 문제는 O, 풀 수 없는 문제는 X 표시해주세요.

    1. 침실 수, 위치 등의 특징을 바탕으로 주택 가격 예측
    2. 기업의 광고비 지출과 매출액과의 관계 파악
    3. 직원의 직무만족에 기여하는 요인의 파악
    4. 구매 내역을 기준으로 고객이 동요할 가능성 예측
    5. 픽셀 값을 기준으로 이미지를 다른 범주로 분류

    < 1번 답 >

    정답

    [이종혁]

    1. X
    2. O
    3. Underfitting Appropriate fitting Overfitting이다. 그래프가 각각 0개 3개 5개를 지나고 있기 때문
    4. O
    5. O 출처가 불분명

2번

문제내용

다음 보기에 대해 옳지 않은 것을 모두 고르시오.

list1 = [1, 2, 3, 4, 5]
list2 = [[1], [2], [3], [4], [5]]

array1 = np.array(list1)
array2 = np.array(list2)
  1. print(list1)과 print(array1) 한 값은 일치한다.
  2. array1 의 크기를 (5, 1) 이라고 표현한다.
  3. 사이킷 런의 train set로 적합한 형태는 array2이다.
  4. array3 = array1.reshape(1,5) 를 한다면 array1의 크기도 변경된다.