EDA
-
[n111] EDA 데이터 전처리AI 부트캠프 2021. 9. 9. 10:27
데이터셋 불러오기 1. 데이터셋에 대한 정보를 파악한다. 행과 열의 수 열에 헤더가 있는가? 결측 데이터 (MIssing Data)가 있는가 원본의 형태 파악하기 : 빅데이터의 크기는 몇 기가~테라 단위인 경우가 있다. 미리 원본 형태를 파악 안하면 에러가 나도 알기 힘들다. 2. Pandas (데이터 관련된 함수를 모아 놓은 라이브러리) pandas.read_csv()로 데이터셋을 불러온다. 데이터셋을 colab에서 확인하는 방법 (권장하지 않는다) ktng_data_url = 'https://ds-lecture-data.s3.ap-northeast-2.amazonaws.com/kt%26g/kt%26g_0.csv' import pandas as pd # 데이터셋에 헤더 값을 넣어준다. column_he..