5조 답안 | Notion

B가 sum 연산을 적용받는 컬럼, A가 묶음의 기준이 되는 컬럼) 3. groupby를 통해 2개의 column으로 묶으면 1개의 index가 생성된다 (O). 4. groupby로 추출된 정보는 Aggregation, Transformation, Filteration 의 세가지의 유형의 apply가 가능하다. (O) 5. groupby에서 matrix() 함수를 사용하면 Group으로 묶여진 데이터를 matrix 형태로 전환해줄 수 있다. (X => unstack() 함수) 6. df.groupby(A)[B].C()에서 A,B,C는 각각 적용받은 column, 묶음의 기준이 되는 column, 적용받는 연산에 해당한다. (X => A: 묶음의 기준이 되는 컬럼, B: 적용받은 컬럼, C: 적용받는 연산) 7. aggregation은 특정 column 에 하나의 function만 apply 가능하다. (X => 여러 개도 가능) 8. merge를 사용하여 두 데이터를 합칠 때, 하나의 column 요인에 대해서만 합칠 수 있다. (O) ################################### Q2: 다음 출력 결과가 나오게 하는 명령어 A에 해당하는 것을 고르시오. import pandas as pd raw_data = { 'subject_id': ['1', '2', '3', '4', '5', '7', '8', '9', '10', '11'], 'test_score': [51, 15, 15, 61, 16, 14, 15, 1, 61, 16]} df_a = pd.DataFram"> B가 sum 연산을 적용받는 컬럼, A가 묶음의 기준이 되는 컬럼) 3. groupby를 통해 2개의 column으로 묶으면 1개의 index가 생성된다 (O). 4. groupby로 추출된 정보는 Aggregation, Transformation, Filteration 의 세가지의 유형의 apply가 가능하다. (O) 5. groupby에서 matrix() 함수를 사용하면 Group으로 묶여진 데이터를 matrix 형태로 전환해줄 수 있다. (X => unstack() 함수) 6. df.groupby(A)[B].C()에서 A,B,C는 각각 적용받은 column, 묶음의 기준이 되는 column, 적용받는 연산에 해당한다. (X => A: 묶음의 기준이 되는 컬럼, B: 적용받은 컬럼, C: 적용받는 연산) 7. aggregation은 특정 column 에 하나의 function만 apply 가능하다. (X => 여러 개도 가능) 8. merge를 사용하여 두 데이터를 합칠 때, 하나의 column 요인에 대해서만 합칠 수 있다. (O) ################################### Q2: 다음 출력 결과가 나오게 하는 명령어 A에 해당하는 것을 고르시오. import pandas as pd raw_data = { 'subject_id': ['1', '2', '3', '4', '5', '7', '8', '9', '10', '11'], 'test_score': [51, 15, 15, 61, 16, 14, 15, 1, 61, 16]} df_a = pd.DataFram"> B가 sum 연산을 적용받는 컬럼, A가 묶음의 기준이 되는 컬럼) 3. groupby를 통해 2개의 column으로 묶으면 1개의 index가 생성된다 (O). 4. groupby로 추출된 정보는 Aggregation, Transformation, Filteration 의 세가지의 유형의 apply가 가능하다. (O) 5. groupby에서 matrix() 함수를 사용하면 Group으로 묶여진 데이터를 matrix 형태로 전환해줄 수 있다. (X => unstack() 함수) 6. df.groupby(A)[B].C()에서 A,B,C는 각각 적용받은 column, 묶음의 기준이 되는 column, 적용받는 연산에 해당한다. (X => A: 묶음의 기준이 되는 컬럼, B: 적용받은 컬럼, C: 적용받는 연산) 7. aggregation은 특정 column 에 하나의 function만 apply 가능하다. (X => 여러 개도 가능) 8. merge를 사용하여 두 데이터를 합칠 때, 하나의 column 요인에 대해서만 합칠 수 있다. (O) ################################### Q2: 다음 출력 결과가 나오게 하는 명령어 A에 해당하는 것을 고르시오. import pandas as pd raw_data = { 'subject_id': ['1', '2', '3', '4', '5', '7', '8', '9', '10', '11'], 'test_score': [51, 15, 15, 61, 16, 14, 15, 1, 61, 16]} df_a = pd.DataFram">

Q1: 다음 padas의 groupby에 대한 설명에 대해 O,X로 판단하시오. 만약 틀린부분이 있다면 옳게 고치시오.

1.groupby는 split,apply,combine 의 과정으로 데이터를 연산한다. (O)

2.df.groupby("A")["B"].sum()의 명령에서 "A"는 sum 연산을 적용받는 컬럼이고 "B"는 묶음의 기준이 되는 컬럼이다.
(X => B가 sum 연산을 적용받는 컬럼, A가 묶음의 기준이 되는 컬럼)

3. groupby를 통해 2개의 column으로 묶으면 1개의 index가 생성된다 (O).

4. groupby로 추출된 정보는 Aggregation, Transformation, Filteration 의 세가지의 유형의 apply가 가능하다. (O)

5. groupby에서 matrix() 함수를 사용하면 Group으로 묶여진 데이터를 matrix 형태로 전환해줄 수 있다. 
(X => unstack() 함수)

6. df.groupby(A)[B].C()에서 A,B,C는 각각 적용받은 column, 묶음의 기준이 되는 column, 적용받는 연산에 해당한다. (X => A: 묶음의 기준이 되는 컬럼, B: 적용받은 컬럼, C: 적용받는 연산)

7. aggregation은 특정 column 에 하나의 function만 apply 가능하다. (X => 여러 개도 가능)

8. merge를 사용하여 두 데이터를 합칠 때, 하나의 column 요인에 대해서만 합칠 수 있다. (O)

###################################
Q2: 다음 출력 결과가 나오게 하는 명령어 A에 해당하는 것을 고르시오.
import pandas as pd
raw_data = {
'subject_id': ['1', '2', '3', '4', '5', '7', '8', '9', '10', '11'],
'test_score': [51, 15, 15, 61, 16, 14, 15, 1, 61, 16]}
df_a = pd.DataFrame(raw_data, columns = ['subject_id', 'test_score'])

raw_data = {
'subject_id': ['4', '5', '6', '7', '8'],
'first_name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'],
'last_name': ['Bonder', 'Black', 'Balwner', 'Brice', 'Btisan']}
df_b = pd.DataFrame(raw_data, columns = ['subject_id', 'first_name', 'last_name'])
df_b

----명령어 A----

명령어 A에 해당하는 것은?

1. pd.merge(df_a, df_b, on='subject_id', how='right')
2. pd.merge(df_a, df_b, on='subject_id', how='outer')
3. pd.merge(df_a, df_b, on='subject_id', how='inner')
4. pd.merge(df_a, df_b, on='subject_id', how='left')
5. pd.merge(df_a, df_b, left_on='subject_id', right_on='subject_id')
(=> 2)

###################################
Q3. 다음 padas의 groupby에 대한 설명에 대해 O,X로 판단하시오. 만약 틀린부분이 있다면 옳게 고치시오.
df.groupby('Team').filter(lambda x:len(x)>=3) 을 실행할 경우, 출력되는 Team에는 Riders, Kings, Royals가 있다.

(X => Kings)

###################################
Q4. 위 그림의 In 입력을 실행하면 출력되는 줄의 번호를 고르시오.

(=> 0, 2, 5)