728x90
max_depth
트리의 최대 깊이를 규정
디폴트는 None
None으로 설정하면 완벽하게 클래스 결정 값이 될 때까지 깊이를 계속 키우며 분할하거나 노드가 가지는 데이터 개수가 min_samples_split보다 작아질 때까지 계속 깊이를 증가시킴
min_samples_split
노드를 분할하기 위한 최소한의 samples 수
디폴트는 2이고, 작게 설정할수록 분할되는 노드 수가 많아져서 과적합 가능성 증가
min_samples_leaf
분할이 될 경우 왼쪽과 오른쪽의 브랜치 노드에서 가져야 할 최소한의 샘플 수 데이터 수
노드가 분할될 경우 자식 노드들이 모두 샘플 데이터 건수가 4 이상을 만족할 수 있는지를 확인한 후에 분할을 수행
max_features
최적의 분할을 위해 고려할 최대 피처 개수디폴트는 None, 데이터 세트의 모든 피처를 사용해 분할 수행
728x90
'머신러닝' 카테고리의 다른 글
[분류] 랜덤포레스트 RandomForest (0) | 2024.03.03 |
---|---|
[분류] DecisionTree GridSearchCV로 하이퍼파라미터 튜닝 해보기 (0) | 2024.03.03 |
anaconda Graphviz 설치 방법 (0) | 2024.03.03 |
[분류] 정밀도와 재현율의 Trade-off, predict_proba(), Binarizer() (0) | 2024.03.02 |
데이터 전처리(Preprocessing) (0) | 2024.03.02 |