728x90
- 데이터 클랜징
- 결손값 처리(Null/NaN 처리)
- 데이터 인코딩(레이블 인코딩, 원-핫 인코딩)
머신러닝은 문자열을 허용하지 않기 때문에 숫자값으로 바꿔줌
- 데이터 스케일링
단위를 맞춰주는 것
- 이상치 제거
- Feature 선택, 추출 및 가공 (피처엔지니어링)
728x90
'머신러닝' 카테고리의 다른 글
anaconda Graphviz 설치 방법 (0) | 2024.03.03 |
---|---|
[분류] 정밀도와 재현율의 Trade-off, predict_proba(), Binarizer() (0) | 2024.03.02 |
[머신러닝] 분류분석 평가 지표 - 오차행렬, ROC (0) | 2024.02.20 |
[머신러닝] 피처스케일링 - StandardScaler, MinMaxScaler (0) | 2024.02.19 |
[머신러닝] 데이터 전처리 - Label Encoding, One-Hot Encoding, get_dummies() (0) | 2024.02.19 |