address=' 전라남도 여수시 학동 신동아 '
address_edit=address.strip()
address_edit
'전라남도 여수시 학동 신동아'
len(address)
17
address_list=address.split()
#안에 ''으로 무엇으로 나눌지 결정 가능
address[:2]
#두번째까지 슬라이싱
' 전'
'전라' in address
#해당 내용이 있는지 확인
True
do=address_list[1]
do
'여수시'
address_list[-1]
'신동아'
'[][]'.join(address_list)
'전라남도[][]여수시[][]학동[][]신동아'
df=pd.DataFrame({'a':[4,5,6], 'b':[7,8,9], 'c':[10,11,12] }, index=[1,2,3])
#dataframe 정의하기
df
a b c
1 4 7 10
2 5 8 11
3 6 9 12
df['a']
#데이터프레임 형태
1 4
2 5
3 6
Name: a, dtype: int64
df[['a', 'b']]
#두 개 이상의 행을 가져올 때는 시리즈 형로 가져옴
a b
1 4 7
2 5 8
3 6 9
df[df['a']>4]
a b c
2 5 8 11
3 6 9 12
df['a'].value_counts()
#빈도수
4 1
5 1
6 1
Name: a, dtype: int64
len(df)
#pandas라이브러리를 통해 찾을 수 있음
3
df.sort_values('a', ascending=False)
#데이터 프레임 a를 내림차순으로 정렬
a b c
3 6 9 12
2 5 8 11
1 4 7 10
df=df.drop(['c'], axis=1)
df
a b
1 4 7
2 5 8
3 6 9
df.groupby(['a'])['b'].agg(['mean', 'sum', 'count'])
#agg함수
mean sum count
a
4 7.0 7 1
5 8.0 8 1
6 9.0 9 1
df.groupby(['a'])['b'].describe()
#한꺼번에
count mean std min 25% 50% 75% max
a
4 1.0 7.0 NaN 7.0 7.0 7.0 7.0 7.0
5 1.0 8.0 NaN 8.0 8.0 8.0 8.0 8.0
6 1.0 9.0 NaN 9.0 9.0 9.0 9.0 9.0
pd.pivot_table(df, index='a', values='b', aggfunc='sum')
b
a
4 7
5 8
6 9
df.plot.area()
#그래프, df.plot.을 한 후에 tab키를 이용해 다양한 그래프 사용 가능
<AxesSubplot: >