df["위도"].dtypes
#평균
df["위도"].mean
#중앙값
df["위도"].median()
#최대값
df["위도"].max()
#최소값
df["위도"].min()
#개수
df["위도"].count()
#요약값 확인
df["위도"].describe()
#두개 이상의 column 요약
df[["위도", "경도"]].describe()
# 숫자로 된 데이터만 요약
df.describe(include="number")
#문자열 데이터만 요약 : object
df.describe(include="object")
#모든 데이터 요약
df.describe(include="all")
결측치는 요약하지 않는다.
#겹치지 않는 값들의 종류 보여줌
df["상권업종대분류명"].unique()
#출력 : array(['의료'], dtype=object)
#갯수 출력 : 몇개의 값을 가지고 있나
df["상권업종대분류명"].nunique()
# 출력 : 1
#각 값들이 몇개인지
df["시도명"].value_counts()
경기도 21374
서울특별시 18943
부산광역시 6473
경상남도 4973
인천광역시 4722
대구광역시 4597
경상북도 4141
전라북도 3894
충청남도 3578
전라남도 3224
광주광역시 3214
대전광역시 3067
충청북도 2677
강원도 2634
울산광역시 1997
제주특별자치도 1095
세종특별자치시 353
Name: 시도명, dtype: int64
normalize 옵션 : 전체에서 차지하는 비율 계산
df["시도명"].value_counts(normalize=True)
경기도 0.234993
서울특별시 0.208266
부산광역시 0.071166
경상남도 0.054675
인천광역시 0.051915
대구광역시 0.050541
경상북도 0.045528
전라북도 0.042812
충청남도 0.039338
전라남도 0.035446
광주광역시 0.035336
대전광역시 0.033720
충청북도 0.029432
강원도 0.028959
울산광역시 0.021956
제주특별자치도 0.012039
세종특별자치시 0.003881
Name: 시도명, dtype: float64