파일에서 데이터 불러오기

pd.read_csv(파일 경로)

import pandas as pd

df = pd.read_csv('C:/Users/Neverland/Desktop/SAI/test.csv')

df 가져오고 df 입력시 파일 데이터 출력됨.

   ID LAST_NAME  AGE
0   1       KIM   30
1   2      CHOI   25
2   3       LEE   41
3   4      PARK   19
4   5       LIM   36

쉼표로 데이터가 구분되어 입력된 txt 파일도 불러올 수 있다.

df.head()

기본적으로 처음부터 5개까지의 데이터를 보여준다.

head(2)와 같이 숫자 입력시 입력된 숫자만큼의 데이터를 보여준다.
df.tail()

기본적으로 뒤부터 5개의 데이터를 보여준다.

숫자 입력시 입력된 숫자만큼의 데이터를 보여준다.

df.head()
   ID LAST_NAME  AGE
0   1       KIM   30
1   2      CHOI   25
2   3       LEE   41
3   4      PARK   19
4   5       LIM   36

df.head(1)
   ID LAST_NAME  AGE
0   1       KIM   30

df.tail()
   ID LAST_NAME  AGE
0   1       KIM   30
1   2      CHOI   25
2   3       LEE   41
3   4      PARK   19
4   5       LIM   36

df.tail(3)
   ID LAST_NAME  AGE
2   3       LEE   41
3   4      PARK   19
4   5       LIM   36

데이터가 탭으로 구분되어 있을 경우

df = pd.read_csv('파일경로.txt', delimiter = '\t')

delimiter 값을 추가로 입력해야 한다.

ID, LAST_NAME, AGE와 같은 head가 없는 데이터의 경우

그냥 데이터를 불러오면 첫 행의 데이터를 head로 사용한다.

df = pd.read_csv('파일경로.txt', header = None)

0          1    2
0  ID  LAST_NAME  AGE
1   1        KIM   30
2   2       CHOI   25
3   3        LEE   41
4   4       PARK   19
5   5        LIM   36

이렇게 할 경우 column name이 그냥 index 값으로 들어간다.

df.columns = []를 이용해 이름 지정이 가능하다.

import pandas as pd

df = pd.read_csv('C:/Users/Neverland/Desktop/SAI/test.csv', header = None)
df.columns = ['name', 'age', 'job']

name        age  job
0   ID  LAST_NAME  AGE
1    1        KIM   30
2    2       CHOI   25
3    3        LEE   41
4    4       PARK   19
5    5        LIM   36