1번

#이나
import numpy as np
arr1 = np.arange(1, 13).reshape(3,4)
arr2 = np.arange(13, 25).reshape(3,4)
arr3 = np.append(arr1, arr2, axis = 1)
print(arr3)

#종혁
import numpy as np
arr1 = np.arange(1, 13).reshape(3, 4)
arr2 = np.arange(13, 25).reshape(3, 4)	
arr3 = np.concatenate((arr1, arr2), axis=1)
print(arr3)

2번

문제내용

Dataset에 대한 설명 중 틀린 것을 모두 골라 주세요.

학습이 끝난 후 모델 평가에 쓰이는 Test set은 Train set에서 사용하지 않은 데이터여야 한다.
1.의 이유는 평가를 할 때에는 모델이 본 적있는 데이터가 아닌 처음 보는 데이터로 해야하기 때문이다.
Dataset을 Train set : Test set = 1 : 1 비율로 나누면 Overfitting이 발생할 수 있다.
Overfitting을 방지하기 위한 방법으로 Validation set를 만드는 방법이 있다.
Validation set의 사용 목적은 Test set과 일치한다.

3,5번 틀림 4번은 애매하다.

3번 일반적으로는 underfitting. 잘못 섞으면 overfitting도 발생가능.

5번 희철님 표…

스크린샷 2023-03-13 오후 11.43.35.png

3번 - 종혁님

[주성]
from sklearn.datasets import load_wine
wine = load_wine()
df = pd.DataFrame(data=wine.data,columns=wine.feature_names)
plt.scatter(df['alcohol'], df['malic_acid'], marker='^', color='b',label = 'alcohol-malic_acid ')
plt.scatter(df['ash'], df['alcalinity_of_ash'], marker='v', color='r', label = 'ash-alcalinity_of_ash')
plt.title('Scatter Plot')
plt.legend()
plt.show()