데이터 전처리(Preprocessing)

2024. 3. 2. 19:52·머신러닝
728x90
  • 데이터 클랜징
  • 결손값 처리(Null/NaN 처리)
  • 데이터 인코딩(레이블 인코딩, 원-핫 인코딩)

             머신러닝은 문자열을 허용하지 않기 때문에 숫자값으로 바꿔줌

  • 데이터 스케일링

    단위를 맞춰주는 것

  • 이상치 제거

    

  • Feature 선택, 추출 및 가공 (피처엔지니어링)

 

728x90

'머신러닝' 카테고리의 다른 글

anaconda Graphviz 설치 방법  (0) 2024.03.03
[분류] 정밀도와 재현율의 Trade-off, predict_proba(), Binarizer()  (0) 2024.03.02
[머신러닝] 분류분석 평가 지표 - 오차행렬, ROC  (0) 2024.02.20
[머신러닝] 피처스케일링 - StandardScaler, MinMaxScaler  (0) 2024.02.19
[머신러닝] 데이터 전처리 - Label Encoding, One-Hot Encoding, get_dummies()  (0) 2024.02.19
'머신러닝' 카테고리의 다른 글
  • anaconda Graphviz 설치 방법
  • [분류] 정밀도와 재현율의 Trade-off, predict_proba(), Binarizer()
  • [머신러닝] 분류분석 평가 지표 - 오차행렬, ROC
  • [머신러닝] 피처스케일링 - StandardScaler, MinMaxScaler
GinaKim
GinaKim
안녕하세요! 반갑습니다 :)
  • GinaKim
    디디
    GinaKim
  • 전체
    오늘
    어제
    • 분류 전체보기 (91)
      • Python (43)
        • Python 기초문법 (25)
        • 데이터 시각화 (5)
        • 통계 (8)
        • 크롤링 (5)
      • git (5)
      • streamlit (5)
      • django (5)
      • 머신러닝 (18)
      • Spark (4)
      • Google Cloud Platform (8)
      • Tableau (0)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.0
GinaKim
데이터 전처리(Preprocessing)
상단으로

티스토리툴바