bar plot, line plot, scatter plot, lm plot, 히트맵, 상자수염그림, swarm plot, 도수분포표, 히스토그램
import pandas as pd
import numpy as np
import warnings
warnings.filterwarnings("ignore")
데이터 불러오기
# 인코딩을 하지 않을 경우, 파일 로드하며 한글이 깨진다.
df_last = pd.read_csv('data/주택도시보증공사_전국 평균 분양가격(2019년 12월).csv', encoding="cp949")
# 데이터 크기
df_last.shape
2015년 분양가 데이터 불러오기
# 총 2개의 데이터 df_first, df_last가 불러왔다.
df_first = pd.read_csv('data/전국 평균 분양가격(2013년 9월부터 2015년 8월까지).csv', encoding="cp949")
df_first.shape
# 지역명, 전용면적으로 평당분양가격의 평균을 구합니다.
# unstack() 하면 groupby 하고자 하는 내용이 컬럼으로 나온다.
# round() 하면 소숫점 1자리까지만 보여준다.
df_last.groupby(["전용면적", "지역명"])["평당분양가격"].mean().unstack().round()
# 연도, 지역명으로 평당분양가격의 평균을 구합니다.
g = df_last.groupby(["연도", "지역명"])["평당분양가격"].mean()
g
# g.unstack().transpose()