릿지
-
[n213] Ridge RegressionAI 부트캠프 2021. 10. 20. 15:22
One-hot Encoding 피처 값의 유형에 따라 새로운 피처를 추가해 고유 값에 해당하는 칼z럼에만 1을 표시하고 나머지 칼럼에는 0을 표시하는 방식. - 순서가 없는 범주형 자료 : 명목형 (Nominal) - 순서가 있는 범주형 자료 : 순서형 (Ordinal) 순서가 의미 없는 범주들은 one-hot 인코딩 하는 것이 좋다. 각 카테고리에 해당하는 변수들이 모두 차원에 더해지므로 카테고리가 너무 많은 경우 (high cardinality)에는 사용하기 적합하지 않다. 세 개의 컬럼이지만 2개가 정해지면 나머지 하나는 자동으로 결정되므로 (셋 중 하나의 값이 1이므로), 두개만 넣는다 -> 다중공산성 문제 방지. Regularization 이상치를 조절. weight를 조정하기 위해 규제를 한다..