• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    해결됨

DecisionTreeClassifier 객체의 random_state 값

20.12.20 23:58 작성 조회수 120

0

의사 결정 트리 클래스 DecisionTreeClassifier 객체를 생성할 때 코드가

dt_clf = Decision_TreeClassfier(random_state=11)

이렇게 되던데요, random_state 값이 왜 파라미터로 필요한지 궁금해요. 이 객체는 이후에 학습 데이터 와 테스트 데이터를 받아서 학습과 예측을 수행하잖아요?? 이 과정에서 학습 데이터와 테스트 데이터가 어떻게 분리되었는지는 알 필요가 없는데 이 값이 왜 들어가나요???

답변 1

답변을 작성해보세요.

1

안녕하십니까,

DecisionTreeClassifier에서 사용된 random_state값은 Decision Tree 알고리즘에서 tree 분할 시 random하게 알고리즘이 수행되는 부분에 대해서 고정된 random값을 부여하기 위함입니다. 굳이 안써도 됩니다만, 이게 강의다 보니까, 동일한 결과를 DecisionTree 학습시마다 발생 시키기 위해서 사용한 것입니다. 데이터를 나누는 train_test_split()에 들어가는 random_state하고는 다른 random_state입니다.

감사합니다.