Selection : 넘파이의 인덱싱과 같은 기법

전체 데이터

df
  first_name last_name  age          city
0      jason    miller   42  sanfrancisco
1      molly  jacobson   52     baltimore
2       tina       ali   36         miami
3       jake    milner   24       doublas
4        amy     cooze   73        boston

column 이름 없이 사용하는 index number는 row 기준으로 표시

df[:3]
  first_name last_name  age          city
0      jason    miller   42  sanfrancisco
1      molly  jacobson   52     baltimore
2       tina       ali   36         miami

column 이름과 함께 row index 사용시, 해당 column만 가져온다.

df["city"][:3]
0    sanfrancisco
1       baltimore
2           miami
Name: city, dtype: object

series selection : 시리즈데이터에서 row 인덱스를 기준으로도 가능

city_series = df["city"]
city_series[[1,4,2]]
1    baltimore
4       boston
2        miami
Name: city, dtype: object

boolean 인덱스도 가능하다.

Untitled

인덱스 변경

column 값을 인덱스에 넣을 수도 있다.

df.index = df["age"]
df
    first_name last_name  age          city
age                                        
42       jason    miller   42  sanfrancisco
52       molly  jacobson   52     baltimore
36        tina       ali   36         miami
24        jake    milner   24       doublas
73         amy     cooze   73        boston