<aside> 💡 연구 주제
</aside>
우리가 투자 목적으로 집을 산다면 어느 지역에 집을 사야 할까?
<aside> 💡 주제
[부제]
<aside> ❗ 사전 정의
- 지역별_지가변동률.csv
- 주택전세가격지수(KB).csv
- **주택매매가격지수(KB).csv**
- 주택건설인허가실적.csv
- **유형별 주택월세통합가격지수.csv**
- 아파트 실거래가격지수.csv
- **미분양주택현황.csv**
- 국내건설수주액.csv
- 건축허가현황.csv
import pandas as pd
from pandas.plotting import parallel_coordinates
import numpy as np
import pickle
import os
from matplotlib import pyplot as plt
from matplotlib import rc
import seaborn as sns
import warnings
warnings.filterwarnings(action='ignore')
def df_to_line_graph(df,tit):
# 한글깨짐 방지
plt.rcParams['font.family'] = 'NanumBarunGothic'
plt.rcParams['font.sans-serif'] = ['Arial']
# 캔버스생성
fig = plt.figure(figsize=(15, 10)) # 캔버스 생성
fig.set_facecolor('white') # 캔버스 색상 설정
# 그림 뼈대(프레임) 생성
ax = fig.add_subplot()
ax.set_xlabel("날짜")
ax.set_ylabel("2019-01-01이 100일때")
# x축 눈금설정
size=len(df)
a=size//12
ax.set_xticks([12*i for i in range(a)])
# 데이터추가
cols=df.columns
for col in cols:
ax.plot(df[col],label=col) ## 선그래프 생성
plt.legend() #범례
plt.xticks(rotation=90) # x축 각도회전
plt.title(tit,fontsize=20) # 타이틀설정
plt.grid()
plt.show()
def L_to_pie(L,cols,t):
plt.title(t) #타이틀
plt.pie(L, labels=cols, autopct='%.0f%%') #설정
plt.show()
def returnName(s):
indx=s.index("[")
return s[:indx]
def cumulate_bar(df):
exceptL=["전국[호]","수도권[호]"]
cols=[col for col in df.columns if col not in exceptL]
size=len(cols)
lastSize=12
a=[np.array(df[col][-1*lastSize:]) for col in cols]
# 캔버스생성
fig = plt.figure(figsize=(20, 10))
# x축생성
X=df.index[-1*lastSize:]
myBar=[]
# 막대그리기
myBar.append(plt.bar(X,a[0]))
for i in range(1,size):
myBar.append(plt.bar(X,a[i],bottom=sum(a[:i])))
# 기타
ax = fig.add_subplot()
ax.set_xlabel("날짜",fontsize=18)
ax.set_ylabel("미분양주택(호)",fontsize=18)
plt.title("최근 1년간 미분양주택현황",fontsize=25)
cols=list(map(returnName,cols))
plt.legend(myBar,cols)
plt.show()
def df_to_pie(df,d):
cols=df.columns
exceptL=["전국[호]","수도권[호]"]
cols=[col for col in df.columns if col not in exceptL]
ratio=df.loc[d,cols]
labels=list(map(returnName,cols))
size=len(ratio)
explode=[0.15 for i in range(size)]
plt.title(d+" 미분양주택현황") #타이틀
plt.pie(ratio, labels=labels, autopct='%.0f%%', explode=explode) #설정
plt.show()
house_price=pd.read_csv("주택매매가격지수(KB).csv",index_col = 0, encoding ='cp949')
house_price_df=house_price.iloc[:,:4]
house_price_df.columns=["총지수","단독주택","연립주택","아파트"]
display(house_price_df)
df_to_line_graph(house_price_df,"주택매매가격지수")
2015년까지 단독주택의 가격이 상대적으로 가장 높다가 이후 아파트의 가격이 가장 높아짐
jonse_price=pd.read_csv("주택전세가격지수(KB).csv", encoding ='utf-8')
jonse_price_df=house_price.iloc[:,:4]
jonse_price_df.columns=["총지수","단독주택","연립주택","아파트"]
display(jonse_price_df)
df_to_line_graph(jonse_price_df,"주택전세가격지수")
2015년까지 단독주택의 가격이 상대적으로 가장 높다가 이후 아파트의 가격이 가장 높아짐