캐글
-
[분류] 캐글 Credit Card Fraud Detection머신러닝 & 딥러닝 2021. 10. 31. 20:26
Kaggle 문제 Credit Card Fraud Detection Anonymized credit card transactions labeled as fraudulent or genuine www.kaggle.com ML 모델 구축 Feature Engineering : 정규 분포, Log 변환, 이상치 제거, SMOTE 오버 샘플링 ML Algorithm : Logistic Regression, LightGBM Log 변환 왜곡된 분포도를 가진 데이터 세트를 비교적 정규 분포에 가깝게 변환해주는 feature engineering 방식 IQR (Inter Quantile Range)를 이용한 Outlier Removal 1분위, 2분위, 3분위, 4분위로 나눈다. 그 중 1/4분위수 Q1 ~ 3/4 ..
-
[사이킷런] 타이타닉 생존자 예측하기머신러닝 & 딥러닝 2021. 10. 1. 19:25
1 데이터 전처리 Null 처리 불필요한 속성 제거 인코딩 수행 2 모델 학습 및 검증/예측/평가 결정트리, 랜덤 포레스트, 로지스틱 회귀 학습 비교 k폴드 교차 검증 cross_val_score(), GridSearchCV() 수행 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline titanic_df = pd.read_csv('./titanic_train.csv') titanic_df.head(3) 2.1 Null 값 처리 titanic_df['Age'].fillna(titanic_df['Age'].mean(), inplace=True) titanic_d..