subway | Notion


#1-1: 데이터프레임을 read하고 ‘총 승차인원’, ‘총 하차인원’, ‘총 승하차인원’ 열 추가하기
import pandas as pd
subway=pd.read_csv('SAITAMA.csv',encoding='cp949')
subway["총 승차인원"]=sum([subway[i] for i in subway.columns if i.endswith('승차인원')])
subway["총 하차인원"]=sum([subway[i] for i in subway.columns if i.endswith('하차인원')])
subway["총 승하차인원"]=subway["총 승차인원"]+subway["총 하차인원"]

#1-2: groupby 활용 2022년 10월 데이터만 분리하고 10월에 승하차인원 제일 많은 역 찾기(환승역은 같이 합계 ex)건대입구역: 2호선+7호선)
subway[subway["사용월"]==202210].groupby("지하철역").sum()['총 승하차인원'].idxmax()

#1-3: 어린이대공원역 → 이수역 → 서울역으로 이동할때 사람이 3번째로 많은 시간대를 출력
a=subway[subway["사용월"]==202210]
p=a[a.지하철역.isin(['어린이대공원(세종대)','이수','서울역','총신대입구(이수)'])&a.호선명.isin(['4호선','7호선'])]
p.index=range(1,5)
p1=p.loc[[1,4]]
p2=p.loc[[2,3]]
p2=[p2[i] for i in p2.columns if i.endswith('승차인원')]
p1=[p1[i] for i in p1.columns if i.endswith('하차인원')]
#(어린이대공원(7호선) 승차, 이수역(7호선) 하차, 이수역(4호선) 승차, 서울역(4호선) 하차)