import pandas as pd
df = pd.read_csv('C:/Users/Neverland/Desktop/SAI/test.csv')
df 가져오고 df 입력시 파일 데이터 출력됨.
ID LAST_NAME AGE
0 1 KIM 30
1 2 CHOI 25
2 3 LEE 41
3 4 PARK 19
4 5 LIM 36
쉼표로 데이터가 구분되어 입력된 txt 파일도 불러올 수 있다.
df.head()
기본적으로 처음부터 5개까지의 데이터를 보여준다.
head(2)와 같이 숫자 입력시 입력된 숫자만큼의 데이터를 보여준다.
df.tail()
기본적으로 뒤부터 5개의 데이터를 보여준다.
숫자 입력시 입력된 숫자만큼의 데이터를 보여준다.
df.head()
ID LAST_NAME AGE
0 1 KIM 30
1 2 CHOI 25
2 3 LEE 41
3 4 PARK 19
4 5 LIM 36
df.head(1)
ID LAST_NAME AGE
0 1 KIM 30
df.tail()
ID LAST_NAME AGE
0 1 KIM 30
1 2 CHOI 25
2 3 LEE 41
3 4 PARK 19
4 5 LIM 36
df.tail(3)
ID LAST_NAME AGE
2 3 LEE 41
3 4 PARK 19
4 5 LIM 36
df = pd.read_csv('파일경로.txt', delimiter = '\\t')
delimiter 값을 추가로 입력해야 한다.
그냥 데이터를 불러오면 첫 행의 데이터를 head로 사용한다.
df = pd.read_csv('파일경로.txt', header = None)
0 1 2
0 ID LAST_NAME AGE
1 1 KIM 30
2 2 CHOI 25
3 3 LEE 41
4 4 PARK 19
5 5 LIM 36
이렇게 할 경우 column name이 그냥 index 값으로 들어간다.
import pandas as pd
df = pd.read_csv('C:/Users/Neverland/Desktop/SAI/test.csv', header = None)
df.columns = ['name', 'age', 'job']
name age job
0 ID LAST_NAME AGE
1 1 KIM 30
2 2 CHOI 25
3 3 LEE 41
4 4 PARK 19
5 5 LIM 36