[넘파이/판다스] remind / 오답

<2,3번 문제>의 데이터프레임 df
- 중복된 데이터값을 삭제하는 함수는 df.drop_duplicated() 이다.
답 : X
drop_duplicates
- groupby() 함수를 활용하여 major 기준으로 그룹화된 데이터를, size()함수를 활용하여 출력하면, 해당 major 그룹 당 갯수가 오름차순으로 출력이 된다.
답 : x
major 이름의 오름차순을 기준으로 출력이 됨.
- print(df.major.value_counts()) 를 활용하면 major 칼럼에 있는 값 중에 각 유니크한 값 별로 몇 개의 데이터가 속하는 지를 출력할 수 있고, 그것의 순서는 데이터 갯수의 오름차순이 된다.
답:x
내림차순이 된다.
- 데이터 프레임을 합치는 함수를 사용할 때, axis=0 옵션은 기본값이다.
답: x
merge,join 함수는 해당이 안됨. 각각 pd.merge(df_left, df_right, how='inner', on=None) 형식, df1.join(df2, how='left') 형식.
- 데이터 프레임을 합치는 함수를 사용할 때, ignore_index=True 옵션을 사용하면 index값이 순차적으로 나온다.
답 : x
merge, join함수는 ignore_index 옵션이 없어서 에러가 난다.
+)
2차원 배열 정렬시 np.sort(변수) 함수를 사용할 경우 기본적으로 행을 기준으로 각각의 배열에서 오름차순으로 배열된다.
답 : (X)
→ 해설: np.sort(변수) 함수를 사용할 경우 기본적으로 axis=1, 즉 열을 기준으로 각각의 배열에서 오름차순으로 배열된다.
벡터(또는 행렬)끼리 덧셈 혹은 뺄셈을 하려면 두 벡터(또는 행렬)의 크기가 같지 않아도 된다.
답 : (X)
→ 해설: 벡터의 덧셈 혹은 뺄셈을 하기 위해서는 두벡터의 크기가 같아야 한다.