Pandas란?

Pandas로 데이터 불러오기

import pandas as pd
import numpy as np

df = pd.read_csv('C:/Users/Neverland/Desktop/SAI/test.csv', header = None)

   0     1   2
0  1   KIM  30
1  2  CHOI  25
2  3   LEE  41
3  4  PARK  19
4  5   LIM  36

type(df.values)
<class 'numpy.ndarray'>
#값의 형태는 numpy다.

Pandas의 구성

기본적으로 series와 dataframe이라고 하는 두 가지의 object로 구성.

Untitled

시리즈 오브젝트를 생성할 때 list 타입, dict 타입을 사용할 수 있다.

import pandas as pd
import numpy as np
from pandas import Series

list_data = [1,2,3,4,5]

ex_obj = Series(data = list_data)

ex_obj
0    1
1    2
2    3
3    4
4    5
dtype: int64

Untitled

인덱스, 데이터, 데이터 타입이 출력된다.

인덱스의 이름을 지정할 수도 있다.

import pandas as pd
import numpy as np
from pandas import Series

list_data = [1,2,3,4,5]
list_name = ["a", "b", "c", "d", "e"]

ex_obj = Series(data = list_data, index = list_name)

ex_obj
a    1
b    2
c    3
d    4
e    5
dtype: int64