김의인 | Notion

address=' 전라남도 여수시 학동 신동아 '
address_edit=address.strip()
address_edit
'전라남도 여수시 학동 신동아'
len(address)
17
address_list=address.split()
#안에 ''으로 무엇으로 나눌지 결정 가능
address[:2]
#두번째까지 슬라이싱
' 전'
'전라' in address
#해당 내용이 있는지 확인
True
do=address_list[1]
do
'여수시'
address_list[-1]
'신동아'
'[][]'.join(address_list)
'전라남도[][]여수시[][]학동[][]신동아'
df=pd.DataFrame({'a':[4,5,6], 'b':[7,8,9], 'c':[10,11,12] }, index=[1,2,3])
#dataframe 정의하기
df
a	b	c
1	4	7	10
2	5	8	11
3	6	9	12
df['a']
#데이터프레임 형태
1    4
2    5
3    6
Name: a, dtype: int64
df[['a', 'b']]
#두 개 이상의 행을 가져올 때는 시리즈 형로 가져옴
a	b
1	4	7
2	5	8
3	6	9
df[df['a']>4]
a	b	c
2	5	8	11
3	6	9	12
df['a'].value_counts() 
#빈도수
4    1
5    1
6    1
Name: a, dtype: int64
len(df)
#pandas라이브러리를 통해 찾을 수 있음
3
df.sort_values('a', ascending=False)
#데이터 프레임 a를 내림차순으로 정렬
a	b	c
3	6	9	12
2	5	8	11
1	4	7	10
df=df.drop(['c'], axis=1)
df
a	b
1	4	7
2	5	8
3	6	9
df.groupby(['a'])['b'].agg(['mean', 'sum', 'count'])
#agg함수
mean	sum	count
a			
4	7.0	7	1
5	8.0	8	1
6	9.0	9	1
df.groupby(['a'])['b'].describe()
#한꺼번에
count	mean	std	min	25%	50%	75%	max
a								
4	1.0	7.0	NaN	7.0	7.0	7.0	7.0	7.0
5	1.0	8.0	NaN	8.0	8.0	8.0	8.0	8.0
6	1.0	9.0	NaN	9.0	9.0	9.0	9.0	9.0
pd.pivot_table(df, index='a', values='b', aggfunc='sum')
b
a	
4	7
5	8
6	9
df.plot.area()
#그래프, df.plot.을 한 후에 tab키를 이용해 다양한 그래프 사용 가능
<AxesSubplot: >