데이터 전처리 과정
신경망, SVM 같은 알고리즘은 데이터 스케일에 매우 민감하다.
알고리즘들에 맞게 데이터의 특성 값을 조정
스케일의 조정효과는 크다.
1. StandardScaler
- z-score 구하기 (평균=0, 분산=1)
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
2. MinMaxScaler
- 모든 특성이 정확하게 0과 1 사이로 위치
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
X_train_scaled = scaler.fit_transform(X_train)
'Programming > Machine Learning' 카테고리의 다른 글
k-겹 교차검증 (0) | 2020.02.16 |
---|---|
특성 자동 선택 (0) | 2020.02.15 |
머신러닝 모델 - 간단한 요약 (0) | 2020.02.15 |
결정 트리 (0) | 2020.02.15 |
선형모델 (0) | 2020.02.14 |