공공데이터 상권정보 분석해보기(추가문제)

[문제1]언어치료는 시군구별로 어디에 많이 위치할까?

import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from google.colab import files

#시각화를 위한 폰트 설정
!sudo apt-get install -y fonts-nanum
!sudo fc-cache -fv
!rm ~/.cache/matplotlib -rf

plt.rc('font',family = 'NanumBarunGothic')

from IPython.display import set_matplotlib_formats
%config InlineBackend.figure_format = 'retina'
%matplotlib inline

#데이터 불러오기
df = pd.read_csv('data.csv')

#데이터 색인
#상권업종소분류명이 언어치료인 데이터만 가져오기
df_st = df[df["상권업종소분류명"]=="언어치료"]
df1=df_language["시도명"].value_counts(normalize=True)

#시도명별로 개수 확인
df_st["시도명"].value_counts().plot.barh()
plt.title("<시,도 별 언어치료 병원>")
#시군구명별로 개수 확인
df_st["시군구명"].value_counts().plot.barh()
plt.title("<시군구 별 언어치료 병원>")

df_language_seoul= df[
    (df["상권업종소분류명"]=="언어치료") &
    (df["시도명"] == "서울특별시")]
    
df1=df_language_seoul['시군구명'].value_counts()
df1.plot.barh()
plt.title("서울시의 자치구별 언어치료병원")

화면 캡처 2022-11-20 174613.png

서울시의 자치구별 언어치료병원.png

다운로드.png

[문제2]의료시설은 서울과 강남에 집중되어 있을까?

#전국 시도별 의료시설의 수
df['시도명'].value_counts()
df["시도명"].value_counts().plot.barh(figsize=(7, 7),color='violet')
plt.title("시,도별 의료시설의 수")

#서울의 자치구 중에서 강남에 의료시설이 집중되어있을까?(지도)
df_medical = df[(df["시도명"] == "서울특별시")]

df_medical["시도명"].value_counts()
plt.figure(figsize=(16, 12))
sns.scatterplot(data = df_medical,
                x='경도', y='위도', hue='시군구명')
#막대 그래프로 분포 살펴보기
df_medical['시군구명'].value_counts().plot.barh(figsize=(8,6),color='darksalmon')
plt.title('서울특별시 자치구별 의료시설 수')

다운로드 (1).png

다운로드 (2).png

다운로드 (4).png

시, 도를 기준으로 살펴보았을 때, 서울 보다 경기도에서 더 많았음. 수도권에 의료시설들이 집중되어있음을 알수 있었음.

서울특별시의 자치구를 기준으로 살펴보았을 때 흔히 강남이라 일컫는 강남+서초+송파에 집중되어있었음. 의외로 동대문구에 의료시설이 많이 존재하는데, 이는 동대문구에 거주하는 인구수나 연령 비율과 상관이 있을수도 있음.

[문제3]강남에는 피부과, 성형외과가 다른 지역에 비해 많을까?

#데이터 색인
#상권업종소분류명이 피부과, 성형외과인 데이터만 가져오기
df_dnp = df[df["상권업종소분류명"].isin(["피부과","정형/성형외과"])]

#서울에 있는 피부과, 성형외과 데이터만 가져오기
df_dnp_seoul = df_dnp[df_dnp["시도명"] == "서울특별시"]

#서울에 있는 피부과, 성형외과의 경도와 위도 표시
df_dnp_seoul[["경도", "위도", "시군구명"]].plot.scatter(
    x="경도", y="위도", figsize=(9, 7), grid=True)
#서울에 있는 피부과, 성형외과 수 막대 그래프로 표시
df_dnp_seoul['시군구명'].value_counts().plot.barh(figsize=(8,6))
#데이터 색인
#상권업종소분류명이 피부과, 성형외과인 데이터만 가져오기
df_dnp = df[df["상권업종소분류명"].isin(["피부과","정형/성형외과"])]

#서울에 있는 피부과, 성형외과 데이터만 가져오기
df_dnp_seoul = df_dnp[df_dnp["시도명"] == "서울특별시"]

#서울에 있는 피부과, 성형외과의 경도와 위도 표시
df_dnp_seoul[["경도", "위도", "시군구명"]].plot.scatter(
    x="경도", y="위도", figsize=(9, 7), grid=True)
#서울에 있는 피부과, 성형외과 수 막대 그래프로 표시
df_dnp_seoul['시군구명'].value_counts().plot.barh(figsize=(8,6))

다운로드 (3).png

다운로드 (5).png

다른지역에 비해 강남구 현저히 많음.