-
[판다스] pivot table로 데이터 집계하기데이터 분석 2021. 9. 12. 18:31
pivot table과 groupby 차이점
groupby 대신 pivot_table로 데이터 집계 가능하다.
- groupby를 사용하면 series 형태로 결과가 나온다.
- pivot_table 결과는 data frame 형태로 결과가 나온다.
pivot_table 예시
평당분양가격의 평균값을 지역명에 따라 집계 하라.
pd.pivot_table(df_last, index=["지역명"], values=["평당분양가격"], aggfunc="mean")
# df_last.groupby(["전용면적"])["평당분양가격"].mean() # pivot과 pivot_table의 가장 큰 차이점은 aggregation 기능이 있느냐 없느냐 차이. # pivot_table의 aggregation default 값은 mean. pd.pivot_table(df_last, index="전용면적", values="평당분양가격")
# 지역명, 전용면적으로 평당분양가격의 평균을 구합니다. # df_last.groupby(["전용면적", "지역명"])["평당분양가격"].mean().unstack().round() # groupby는 series이므로 연산 속도가 더 빠르다. df_last.pivot_table(index="전용면적", columns="지역명", values="평당분양가격").round()
# 연도, 지역명으로 평당분양가격의 평균을 구합니다. # g = df_last.groupby(["연도", "지역명"])["평당분양가격"].mean() p = pd.pivot_table(df_last, index=["연도", "지역명"], values="평당분양가격") # 행을 기준으로 가져올 때 loc를 쓴다. 2017년 데이터만 갖고 오고 싶으면 다음과 같다. p.loc[2017]
GitHub - DAWUNHAN/DataAnalysisInPython
Contribute to DAWUNHAN/DataAnalysisInPython development by creating an account on GitHub.
github.com
'데이터 분석' 카테고리의 다른 글
[상권 정보 분석] 전처리 과정 (0) 2021.09.13 [데이터 시각화] 히트맵 및 swarmplot (0) 2021.09.12 [데이터전처리] 컬럼이 다른 데이터셋 병합하기 (0) 2021.09.12 [판다스&Seaborn] 데이터 시각화 (line, bar, relplot, catplot, violinplot, boxplot) (0) 2021.09.12 [판다스] 아파트 분양 가격 데이터 분석 (0) 2021.09.10