데이터분석
-
[프랜차이즈 분석] 파리바게트와 뚜레쥬르 위치 분석데이터 분석 2021. 9. 19. 20:22
파리바게트와 뚜레쥬르 매장 위치가 서로 어떤 관계를 갖는지 데이터 분석 해보자. 데이터 가져오기 df_seoul['상호명'].str.extract("뚜레(주|쥬)르")[0].value_counts() df_bread = df_seoul[df_seoul["상호명"].str.contains("뚜레(주|쥬)르|파리(바게|크라상)")].copy() df_bread.shape df_bread.head(10) 범주형 변수 빈도수 계산하기 # 비율을 알아본다. df_bread["브랜드명"].value_counts(normalize=True) sns.countplot(data=df_bread, x="브랜드명") plt.figure(figsize=(15, 4)) sns.countplot(data=df_bread, x="..
-
[프랜차이즈 분석] 배스킨라빈스와 던킨 위치 분석데이터 분석 2021. 9. 18. 21:59
데이터 불러오기공공데이터 포털 : https://www.data.go.kr/dataset/15012005/fileData.do공공데이터 포털에서 소상공인시장진흥공단 상가업소정보를 다운로드 받아 사용했습니다 df = pd.read_csv('data/상가업소정보_201912_01.csv', sep='|')df.head() 서울 데이터 서브셋으로 가져오기# 서브셋을 만들때 copy 하기! 데이터 오류 발생 방지df_seoul = df[df['시도명'] == '서울특별시'].copy()print(df_seoul.shape)df_seoul.head() 서울의 배스킨라빈스와 던킨도너츠 데이터 가져오기# 상호명을 소문자로 변경df_seoul["상호명_소문자"] = df_seoul["상호명"].st..
-
[상권 정보 분석] Folium으로 지도 시각화하기데이터 분석 2021. 9. 15. 16:28
Folium 설치하기 주피터 노트북에서 설치하지 않고, cmd에서 따로 설치해야 한다. conda install -c conda-forge folium Quickstart — Folium 0.12.1 documentation Vincent/Vega and Altair/VegaLite Markers folium enables passing any HTML object as a popup, including `bokeh `__ plots, but there is a built-in support for vincent and altair visualizations to any marker type, with the python-visualization.github.io 지도 불러 오기 내가 살았던 집의 경도..
-
[판다스] pivot table로 데이터 집계하기데이터 분석 2021. 9. 12. 18:31
pivot table과 groupby 차이점 groupby 대신 pivot_table로 데이터 집계 가능하다. groupby를 사용하면 series 형태로 결과가 나온다. pivot_table 결과는 data frame 형태로 결과가 나온다. pivot_table 예시 평당분양가격의 평균값을 지역명에 따라 집계 하라. pd.pivot_table(df_last, index=["지역명"], values=["평당분양가격"], aggfunc="mean") # df_last.groupby(["전용면적"])["평당분양가격"].mean() # pivot과 pivot_table의 가장 큰 차이점은 aggregation 기능이 있느냐 없느냐 차이. # pivot_table의 aggregation default 값은 me..
-
[판다스] 아파트 분양 가격 데이터 분석데이터 분석 2021. 9. 10. 22:17
분석 내용 2013년부터 2019년까지의 전국 신규 민간 아파트의 분양 가격 동향을 분석한다. 다른 데이터셋을 가공하여 병합한다. 데이터 전처리 후에 시각화한다. 데이터셋은 공공데이터 포럼 (https://www.data.go.kr) 전국 평균 분양가격(2013년 9월부터 2015년 8월까지) 주택도시보증공사_전국 평균 분양가격(2019년 12월) 활용 functions concat, pivot, transpose in Pandas groupby, pivot_table, info, describe, value_counts bar plot, line plot, scatter plot, lm plot, 히트맵, 상자수염그림, swarm plot, 도수분포표, 히스토그램 import pandas as pd i..