1번
다음중 Supervised learning과 Unsupervised learning에 대하여 틀리게 설명한 것을 골라 주세요.
—> 4번. Unsupervised learning과 Supervised learning 모두 training set이 필요하다. 다만 target 데이터가 없을 때는 Unsupervised를, 있을 때는 Supervised 사용한다.
2번
Dataset에 대한 설명 중 틀린 것을 모두 골라 주세요.
—> 5번, Validation set은 여러 모델들 각각에 적용되어 성능을 측정하며, 최종 모델을 선정하기 위해 사용된다. 반면 test set은 최종 모델에 대해 마지막으로 정확도를 측정하며, 앞으로 기대되는 성능을 예측하기 위해 사용된다는 점에서 Validation set과 사용 목적이 다르다.
3번
#모듈 불러오기
import pandas as pd
#iris 데이터를 데이터프레임화 시키기
f_names = iris['feature_names']
data = iris['data']
df = pd.DataFrame(data, columns = f_names)
#column이름 재설정
df.rename(columns = {'sepal length (cm)' : 'sepal length',
'sepal width (cm)' : 'sepal width',
'petal length (cm)' : 'petal length',
'petal width (cm)' : 'petal width'}, inplace = True)
#산점도 그리기
plt.figure(figsize = (8,6))
plt.subplot(2,1,1)
plt.scatter(df['sepal length'], df['sepal width'], c = 'red')
plt.xlabel('sepal legnth (cm)')
plt.ylabel('sepal width (cm)')
plt.subplot(2,1,2)
plt.scatter(df['petal length'], df['petal width'], c = 'blue')
plt.xlabel('petal length (cm)')
plt.ylabel('petal width (cm)')
plt.show()
