3조 답안 | Notion

X, “A”는 묶음의 기준이 되는 컬럼이고 “B”는 sum 연산을 적용받는 컬럼이다. 3.groupby를 통해 2개의 column으로 묶으면 1개의 index가 생성된다. -> X, 2개의 index가 생성된다 4.groupby로 추출된 정보는 Aggregation, Transformation, Filteration 의 세가지의 유형의 apply가 가능하다. -> O 5.groupby에서 matrix() 함수를 사용하면 Group으로 묶여진 데이터를 matrix 형태로 전환해줄 수 있다. -> X, matrix() 함수가 아닌 unstack() 함수를 사용한다. 6. df.groupby(A)[B].C()에서 A,B,C는 각각 적용받은 column, 묶음의 기준이 되는 column, 적용받는 연산에 해당한다. -> X, 각각 묶음의 기준이 되는 컬럼,적용받는 컬럼,적용받는 연산에 해당한다. 7. aggregation은 특정 column 에 하나의 function만 apply 가능하다. -> X, 특정 column에 여러 개의 function을 apply 할 수도 있다. 8. merge를 사용하여 두 데이터를 합칠 때, 하나의 column 요인에 대해서만 합칠 수 있다. -> X, 여러 column 요인에 대해서 합칠 수 있다."> X, “A”는 묶음의 기준이 되는 컬럼이고 “B”는 sum 연산을 적용받는 컬럼이다. 3.groupby를 통해 2개의 column으로 묶으면 1개의 index가 생성된다. -> X, 2개의 index가 생성된다 4.groupby로 추출된 정보는 Aggregation, Transformation, Filteration 의 세가지의 유형의 apply가 가능하다. -> O 5.groupby에서 matrix() 함수를 사용하면 Group으로 묶여진 데이터를 matrix 형태로 전환해줄 수 있다. -> X, matrix() 함수가 아닌 unstack() 함수를 사용한다. 6. df.groupby(A)[B].C()에서 A,B,C는 각각 적용받은 column, 묶음의 기준이 되는 column, 적용받는 연산에 해당한다. -> X, 각각 묶음의 기준이 되는 컬럼,적용받는 컬럼,적용받는 연산에 해당한다. 7. aggregation은 특정 column 에 하나의 function만 apply 가능하다. -> X, 특정 column에 여러 개의 function을 apply 할 수도 있다. 8. merge를 사용하여 두 데이터를 합칠 때, 하나의 column 요인에 대해서만 합칠 수 있다. -> X, 여러 column 요인에 대해서 합칠 수 있다."> X, “A”는 묶음의 기준이 되는 컬럼이고 “B”는 sum 연산을 적용받는 컬럼이다. 3.groupby를 통해 2개의 column으로 묶으면 1개의 index가 생성된다. -> X, 2개의 index가 생성된다 4.groupby로 추출된 정보는 Aggregation, Transformation, Filteration 의 세가지의 유형의 apply가 가능하다. -> O 5.groupby에서 matrix() 함수를 사용하면 Group으로 묶여진 데이터를 matrix 형태로 전환해줄 수 있다. -> X, matrix() 함수가 아닌 unstack() 함수를 사용한다. 6. df.groupby(A)[B].C()에서 A,B,C는 각각 적용받은 column, 묶음의 기준이 되는 column, 적용받는 연산에 해당한다. -> X, 각각 묶음의 기준이 되는 컬럼,적용받는 컬럼,적용받는 연산에 해당한다. 7. aggregation은 특정 column 에 하나의 function만 apply 가능하다. -> X, 특정 column에 여러 개의 function을 apply 할 수도 있다. 8. merge를 사용하여 두 데이터를 합칠 때, 하나의 column 요인에 대해서만 합칠 수 있다. -> X, 여러 column 요인에 대해서 합칠 수 있다.">

Q: 다음 padas의 groupby에 대한 설명에 대해 O,X로 판단하시오. 만약 틀린부분이 있다면 옳게 고치시오.

1.groupby는 split,apply,combine 의 과정으로 데이터를 연산한다. -> O

2.df.groupby("A")["B"].sum()의 명령에서 "A"는 sum 연산을 적용받는 컬럼이고 "B"는 묶음의 기준이 되는 컬럼이다. 
   -> X, “A”는 묶음의 기준이 되는 컬럼이고 “B”는 sum 연산을 적용받는 컬럼이다.

3.groupby를 통해 2개의 column으로 묶으면 1개의 index가 생성된다. -> X, 2개의 index가 생성된다

4.groupby로 추출된 정보는 Aggregation, Transformation, Filteration 의 세가지의 유형의 apply가 가능하다. -> O

5.groupby에서 matrix() 함수를 사용하면 Group으로 묶여진 데이터를 matrix 형태로 전환해줄 수 있다. 
   -> X, matrix() 함수가 아닌 unstack() 함수를 사용한다.

6. df.groupby(A)[B].C()에서 A,B,C는 각각 적용받은 column, 묶음의 기준이 되는 column, 적용받는 연산에 해당한다. 
   ->  X, 각각 묶음의 기준이 되는 컬럼,적용받는 컬럼,적용받는 연산에 해당한다.

7. aggregation은 특정 column 에 하나의 function만 apply 가능하다. 
   -> X, 특정 column에 여러 개의 function을 apply 할 수도 있다.

8. merge를 사용하여 두 데이터를 합칠 때, 하나의 column 요인에 대해서만 합칠 수 있다.
   -> X, 여러 column 요인에 대해서 합칠 수 있다.


명령어 A에 해당하는 것은?

1. pd.merge(df_a, df_b, on='subject_id', how='right')
2. pd.merge(df_a, df_b, on='subject_id', how='outer')
3. pd.merge(df_a, df_b, on='subject_id', how='inner')
4. pd.merge(df_a, df_b, on='subject_id', how='left')
5. pd.merge(df_a, df_b, left_on='subject_id', right_on='subject_id')

Q. 다음 padas의 groupby에 대한 설명에 대해 O,X로 판단하시오. 만약 틀린부분이 있다면 옳게 고치시오.
df.groupby('Team').filter(lambda x:len(x)>=3) 을 실행할 경우, 출력되는 Team에는 Riders, Kings, Royals가 있다.

  -> X, 출력되는 Team에는 Riders,Kings가 있다.

위 그림의 In 입력을 실행하면 출력되는 줄의 번호를 고르시오.

   -> 0, 2, 5