-
[n111] Pandas in ColabAI 부트캠프 2021. 9. 9. 18:02
데이터셋 불러오기
import pandas as pd travel_data_url = 'https://ds-lecture-data.s3.ap-northeast-2.amazonaws.com/stocks/Travel.xlsx'
# 엑셀 파일의 첫번째 시트를 불러온다. df1 = pd.read_excel(travel_data_url, sheet_name=0) # row 와 column을 서로 transpose 한다. df1 = df1.T # 첫 번째 row를 df1_header에 입력한다. df1_header = df1.iloc[0] # 헤더 아래부터 데이터를 입력한다. df1 = df1[1:] # 첫 번째 row를 헤더로 설정한다. df1.columns = df1_header df1.head()
데이터 확인하기
# 데이터의 dimension을 확인하기 df1.shape # df1 데이터의 결측값을 0으로 채우기 df1 = df1.fillna(0) df1
# df1의 컬럼 FCF 값을 barplot으로 시각화 df1['FCF'].plot.bar();
'FCF' 값이 0보다 크면 num1
# num1값 구하기 num1 = df1.FCF[df1['FCF'] > 0].value_counts().sum()
File Export
# 데이터를 csv로 변환한 뒤 다운로드 한다. from google.colab import files df1.to_csv('df1.csv') files.download('df1.csv')
부트캠프 공부 내용 한 눈에 보기
[인덱스] 코드 스테이츠 AI 부트캠프
구성 2021.09.09 ~ 2022.04 (총 28주) 배우는 내용 Section 1. 데이터 분석 입문 SPRINT 1. EDA SPRINT 2. Statistics SPRINT 3. DAY 1 EDA 데이터 전처리 Pandas in Colab 가설 검정 (t-test) T-Test 행렬 및 벡..
da-journal.com
'AI 부트캠프' 카테고리의 다른 글
[n121] 가설 검정 (t-test) (0) 2021.09.16 [n114] 미분 개념과 경사하강법 (0) 2021.09.14 [n113] Data Manipulation (concat, merge, melt, pivot, conditioning) (0) 2021.09.13 [n112] Feature Engineering (0) 2021.09.10 [n111] EDA 데이터 전처리 (0) 2021.09.09