1. import pandas as pd
import numpy as np
data = {
'A': [1, 2, np.nan, 4],
'B': [np.nan, 2, 3, 4],
}
df = pd.DataFrame(data)
다음 코드에서 nan값을 0으로 변경했을 때의 결과는 무엇인가? (10점)
#------------------------------------------------------------------------------------
2. df의 출력이
yyyy.mm.dd
0 2000.06.28
1 2003.03.28
2 2006.08.25 일 때, year column을 만들려면
def extract_year(column):
return column.split("-")[0] 이라는 함수를 만들면 된다 (O,X) (10점)
#------------------------------------------------------------------------------------
3. x_y = [{'x': 5.5, 'y': -5.6, 'z': -1.1},
{'x': -5.2, 'y': 5.5, 'z': -2.2},
{'x': -1.6, 'y': -4.5, 'z': -3.3}]
df = pd.DataFrame(x_y)에서 데이터프레임 전체의 각 요소에 반올림을 하고자 한다.
map()함수를 이용하면 된다. (O/X) (10점)
#------------------------------------------------------------------------------------
4.
import pandas as pd
df_list = [
{'name': 'Alice', 'job': 'Teacher'},
{'name': 'Bob', 'job': 'Doctor'},
{'name': 'Charlie', 'job': 'Artist'},
{'name': 'David', 'job': 'Teacher'},
{'name': 'Eve', 'job': 'Scientist'}
]
df=pd.DataFrame(df_list,columns=['name','job'])
df.job.unique
의 결과는
array(['Teacher','Doctor','Artist','Teacher','Scientist'], dtype=object)
이다. (o/x) (10점)
#------------------------------------------------------------------------------------
5. 3개의 dataFrame df1,df2,df3가 있을떄
result=df1.append(df2,df3,ignore_index=True)
라고 작성하면 dataFrame의 병합이 가능하다. (o/x) (10점)
김민주, 이예은, 김건중, 유시민, 이계명
김민주, 이예은, 김건중, 유시민, 이계명