머신러닝

[분류] 결정트리 파라미터 DecisionTree parameters

GinaKim 2024. 3. 3. 16:50
728x90

max_depth 

트리의 최대 깊이를 규정

디폴트는 None

None으로 설정하면 완벽하게 클래스 결정 값이 될 때까지 깊이를 계속 키우며 분할하거나 노드가 가지는 데이터 개수가 min_samples_split보다 작아질 때까지 계속 깊이를 증가시킴

min_samples_split

노드를 분할하기 위한 최소한의 samples 수

디폴트는 2이고, 작게 설정할수록 분할되는 노드 수가 많아져서 과적합 가능성 증가

 

min_samples_leaf

분할이 될 경우 왼쪽과 오른쪽의 브랜치 노드에서 가져야 할 최소한의 샘플 수 데이터 수

노드가 분할될 경우 자식 노드들이 모두 샘플 데이터 건수가 4 이상을 만족할 수 있는지를 확인한 후에 분할을 수행

 

max_features 

최적의 분할을 위해 고려할 최대 피처 개수디폴트는 None, 데이터 세트의 모든 피처를 사용해 분할 수행

728x90