판다스(pandas) 기본 사용법 익히기

numpy import & pandas import

import numpy as np

import pandas as pd

pandas 객체 생성

series & dataframe

pd.Series([1, 3, 5, 4, 6, 8]) 시리즈 생성

pd.Series([1, 3.5, 5, 4, 6.2, 8], index=['a', 'b', 'c', 'd', 'e', 'f']) 시리즈 생성 + index 지정

Untitled

dates = pd.date_range('20130101', periods=6)

pd.date_range('기준이 되는 날짜', '주기') 형태로 쓴다.

df = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=list('ABCD'))

#데이터 프레임 생성(시리즈)- pd.DataFrame(입력할 데이터 배열, 인덱스 , 칼럼)

df2 = pd.DataFrame({'A': 1., 'B': pd.Timestamp('20130102'), 'C': pd.Series(1, index=list(range(4)), dtype='float32'), 'D': np.array([3] * 4, dtype='int32'), 'E': pd.Categorical(["test", "train", "test", "train"]), 'F': 'foo'})

#데이터 프레임 생성(딕셔너리) - pd.DataFrame('딕셔너리 키(data framel 키)' : 시리즈 or 배열)

df3 = pd.read_csv('pandas_ex01.csv', header=None)

#데이터 프레임 생성(csv) - pd.read_csv('자료이름', header=None(자동 생성))