[판다스] pivot table로 데이터 집계하기

데이터 분석 2021. 9. 12. 18:31

pivot table과 groupby 차이점

groupby 대신 pivot_table로 데이터 집계 가능하다.

groupby를 사용하면 series 형태로 결과가 나온다.
pivot_table 결과는 data frame 형태로 결과가 나온다.

pivot_table 예시

평당분양가격의 평균값을 지역명에 따라 집계 하라.

pd.pivot_table(df_last, index=["지역명"], values=["평당분양가격"], aggfunc="mean")

# df_last.groupby(["전용면적"])["평당분양가격"].mean()
# pivot과 pivot_table의 가장 큰 차이점은 aggregation 기능이 있느냐 없느냐 차이.
# pivot_table의 aggregation default 값은 mean.

pd.pivot_table(df_last, index="전용면적", values="평당분양가격")

# 지역명, 전용면적으로 평당분양가격의 평균을 구합니다.
# df_last.groupby(["전용면적", "지역명"])["평당분양가격"].mean().unstack().round()
# groupby는 series이므로 연산 속도가 더 빠르다.

df_last.pivot_table(index="전용면적", columns="지역명", values="평당분양가격").round()

# 연도, 지역명으로 평당분양가격의 평균을 구합니다.
# g = df_last.groupby(["연도", "지역명"])["평당분양가격"].mean()

p = pd.pivot_table(df_last, index=["연도", "지역명"], values="평당분양가격")
# 행을 기준으로 가져올 때 loc를 쓴다. 2017년 데이터만 갖고 오고 싶으면 다음과 같다. 
p.loc[2017]

GitHub - DAWUNHAN/DataAnalysisInPython

Contribute to DAWUNHAN/DataAnalysisInPython development by creating an account on GitHub.

github.com

저작자표시 비영리 변경금지 (새창열림)

'데이터 분석' 카테고리의 다른 글

[상권 정보 분석] 전처리 과정 (0)	2021.09.13
[데이터 시각화] 히트맵 및 swarmplot (0)	2021.09.12
[데이터전처리] 컬럼이 다른 데이터셋 병합하기 (0)	2021.09.12
[판다스&Seaborn] 데이터 시각화 (line, bar, relplot, catplot, violinplot, boxplot) (0)	2021.09.12
[판다스] 아파트 분양 가격 데이터 분석 (0)	2021.09.10

ABOUT ME

엔지니어 한다운의 저널

pivot table과 groupby 차이점

pivot_table 예시

'데이터 분석' 카테고리의 다른 글

티스토리툴바